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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 各 
个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 家 非 
出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 学 科 中 
的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 辟 划 了 研究 
的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 因 年 月 的 流 
逝 而 减退 。 

近年 ， 在 全 球 信 息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 益 
迫切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 上 显 
得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 发 展 的 
几 十 年 间 积淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计算 机 教材 
将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 的 世界 一 流 
大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 我 们 
就 将 工作 重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson, 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 良好 的 
合作 关系 ,从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, Brian 
W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. Ullman, 
Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry L. Peterson 
等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 究 及 珍藏 。 
大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 中 
国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 两 百 个 
品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 。 其 影 
印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 图 
书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 深化 ， 
教育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 和 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 而 反 
馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工作 提出 
建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 

电子 邮件 :hzjsj@hzbook.com 

联系 电话 : (010) 88379604 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 
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本 书 是 美国 斯 坦 福 大 学 计算 机 科学 系 C++ 编程 课程 多 年 来 成 功 使 用 的 优秀 教材 ， 我 很 荣 
幸 能 成 为 本 书 的 译 者 。 虽 然 在 为 时 一 年 多 的 书稿 翻译 过 程 中 ， 我 倍 感 工 作 量 的 巨大 与 任务 的 艰 
辛 ， 但 却 被 本 书 严谨 的 结构 、 通 俗 精妙 的 语言 以 及 丰富 精巧 的 编程 实例 与 习题 等 深 深 吸引 ， 它 
驱动 我 尽 最 大 努力 翻译 好 这 本 优秀 的 C++ 编程 教材 ， 以 此 呈现 给 国内 教授 C++ 编程 课程 的 高 
校 教师 和 广大 欲 深 入 学 习 C++ 编程 的 大 学 生 、 研 究 生 及 专业 的 C++ 程序 员 。 

本 书 突 破 了 一 般 C++ 编程 教材 大 多 仅 注 重 介绍 C++ 语法 特性 的 局 限 ， 以 循序 渐进 的 方式 
教授 读者 正确 编写 出 可 行 高 效 的 C++ 程序 。 本 书 内 容 不 仅 涵 盖 了 2013 版 ACM 和 IEEE 所 规 
定 的 计算 机 科学 学 科 在 程序 设计 课程 中 所 定义 的 内 容 ， 而 且 为 了 缩短 或 消除 “ C++ 语言 ”和 
“C++ 编程 抽象 ”之 间 的 鸿沟 ， 在 其 示例 和 习题 中 还 包含 了 基本 的 数据 结构 及 算法 课程 中 的 相 
关内 容 。 从 易于 读者 掌握 并 尽快 提高 C++ 面向 对 象 编程 能 力 的 角度 ， 本 书 从 第 3 章 起 便 开 始 
陆续 介绍 C++ 标准 类 库 中 的 类 ， 并 以 示例 程序 和 若干 编程 模式 示范 总 结 了 如 何 使 用 C++ 标准 
类 库 中 的 集合 类 、 递 归 编 程 、 面 向 对 象 程 序 设 计 和 算法 实现 及 分 析 等 技术 ， 同 时 提供 了 一 个 开 
源 的 、 方 便 易 用 的 图 形 化 的 可 移植 C++ 类 库 一 一 Stanford C++ 类 库 。 囊 心 祝愿 广大 读者 能 从 这 
本 优秀 的 C++ 编程 教材 中 受益 ! 

在 本 书 翻译 工作 即将 结束 之 时 ， 衷 心 感谢 机 械 工业 出 版 社 华章 公司 教材 部 朱 动 女士 ， 是 她 
的 努力 才 促 成 译 者 与 华章 公司 在 本 书 翻译 上 的 合作 。 衷 心 感谢 责任 编辑 缪 杰 对 提高 本 书 质量 所 
做 的 大 量 细 致 的 校对 、 修 正 等 工作 。 

这 里 ， 要 特别 感谢 王 雅 雇 、 黄 一 涵 、 刘 可、 汪 泰 利 、 景 祯 彦 等 同学 在 本 书 译 校 过 程 中 的 辛 
勤 付出 。 由 于 时 间 仓 促 上 且 译 者 水 平 有 限 ， 译 文中 难免 存在 欠 妥 、 丝 漏 与 错误 之 处 ， 奶 请 广大 读 
者 不 音 赐教 与 指正 。 
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致 学 生 

在 过 去 的 十 年 里 ， 计 算 领 域 正 令 人 振奋 地 高 速 发 展 着 。 我 们 随身 携带 的 网 络 设备 运行 速度 
越 来 越 快 ， 价 格 越 来 越 便 宜 ， 功 能 也 越 来 越 强 大 。 谷 歌 和 维基 百科 等 基于 网 络 的 服务 给 我 们 提 
供 了 大 量 触手 可 及 的 信息 。 社 交 网 络 把 我 们 同 世 界 各 地 的 人 联系 起 来 。 流 媒体 技术 和 更 快速 的 
硬件 让 我 们 能 在 任何 时 候 下 载 所 需 的 音乐 和 影像 。 

然而 ， 这 些 技术 并 不 是 突然 而 至 的 ， 而 是 人 们 创造 了 它们 。 遗 憾 的 是 ， 具 备 必 需 的 软件 
开发 技能 的 人 现在 正 供不应求 。 在 硅谷 的 高 科技 中 心 ， 很 多 公司 找 不 到 能 把 技术 设想 转化 为 现 
实 应 用 的 工程 师 。 各 个 公司 正在 极力 招聘 懂得 开发 及 维护 大 型 系统 的 人 ， 即 懂得 数据 表示 、 效 
率 、 安 全 性 、 正 确 性 和 模块 化 等 问题 的 软件 开发 人 员 。 

尽管 本 书 不 会 教 给 你 关于 这 些 主题 和 计算 机 科学 领域 的 所 有 知识 ,但 它 会 给 你 一 个 良好 的 
开始 。 在 斯 坦 福 大 学 ， 每 年 有 超过 1000 名 学 生 选 择 使 用 本 教材 上 课 。 他 们 中 的 大 部 分 人 觉得 
在 暑期 实习 或 实际 工作 中 仅仅 学 习 本 教材 中 的 知识 远 远 不 够 。 更 多 的 学 生 选 择 继 续 学 习 更 深入 
的 课程 以 使 自己 在 这 个 高 速 发 展 的 领域 获得 更 多 的 机 会 。 

本 书 的 主题 除了 会 在 计算 机 行业 中 给 你 提供 机 会 外 ， 同 时 它 也 寄 乐 于 学 。 你 在 本 书 中 学 到 的 
算法 和 策略 有 一 部 分 是 最 近 十 年 发 明 的 ， 其 他 的 都 存在 了 超过 2000 年 一 一 它们 充分 体现 了 人 类 
的 聪明 才智 和 创造 力 。 这 些 算法 和 策略 还 非常 实用 ， 它 们 会 帮助 你 成 为 一 个 富有 经 验 的 程序 员 。 

在 你 学 习 本 书 中 的 材料 时 ， 请 牢记 ， 编 程 总 是 需要 通过 实际 操作 来 学 习 的 。 阅 读 一 种 算法 
技术 并 不 代表 你 就 能 够 把 那个 算法 应 用 到 实际 中 去 。 只 有 通过 练习 和 尝试 去 解决 问题 的 调试 ， 
你 才能 真正 学 到 算法 的 精 体 。 编 程 有 时 候 使 人 感觉 很 诅 形 ， 但 是 当 你 找到 最 后 一 个 错误 并 且 看 
到 你 的 程序 正确 运行 时 ， 会 欣喜 若 狂 ， 它 足以 回报 你 在 编程 这 条 道路 上 所 付出 的 任何 努力 。 





致 教师 


本 教材 适合 作为 典型 的 大 学 课程 中 第 二 门 编程 课程 的 教材 。 它 涵盖 了 ACM 的 Curriculum’78 
报告 中 定义 的 传统 CS2 课程 中 的 材料 。 因 此 它 包 含 了 CS102 和 CS103 课程 指定 的 绝 大 多 数 主 
题 ，CS102 和 CS103 分 别 由 “ACMVIEEE-CS 联合 计算 机 课程 2001 版 ”报告 及 “计算 机 科学 
课程 2013 版 ”草稿 中 的 AL/ 基本 数据 结构 及 算法 单元 中 的 材料 定义 。 

本 教材 采用 的 教学 策略 在 斯 坦 福 大 学 已 大 获 成 功 。 

1. 数据 结构 的 客户 优先 方法 。 传 统 的 CS2 课程 由 一 系列 基本 数据 结构 组 成 。 采 用 此 模型 ， 
学 生 可 同时 学 习 如 何 使 用 一 个 特定 的 结构 和 如 何 实 现 它 及 理解 它 的 性 能 特点 。 相 比 之 下 ， 本 教 
材 很 早 地 展现 了 类 的 完整 集合 ， 让 学 生 以 客户 的 身份 逐渐 熟悉 这 些 类 。 一 旦 学 生 透 彻 理解 了 这 
些 内 容 ， 本 书 即 开始 展现 它 可 能 的 实现 范围 和 相关 的 计算 特性 。 在 斯 坦 福 大 学 采用 这 种 策略 有 
助 于 学 生 轻 松 理解 相关 内 容 。 自 从 做 了 这 个 改变 ， 学生 在 需要 使 用 集合 类 的 考试 中 的 分 数 也 有 
了 大 幅度 提高 。 
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2. 稍 晚 呈 现 那些 需要 详细 了 解 底层 机 器 的 C++ 特性 。 尽 管 前 两 章 给 学 生 提 供 了 C++ 中 
基本 类 型 和 控制 结构 的 总 览 ， 但 初始 的 部 分 刻意 地 区 分 了 基本 指针 和 数组 等 依赖 于 对 底层 机 器 
架构 理解 的 主题 。 虽 然 这 些 细节 是 CS2 的 基本 部 分 ， 但 也 没有 必要 在 课程 刚 开 始 的 时 候 就 给 
学 生 过 大 的 负担 。 尽 早 介绍 类 的 集合 使 得 学 生 能 够 掌握 几 个 其 他 同等 重要 的 主题 ， 包 括 集合 
类 、 递 归 、 面 向 对 象 设 计 和 算法 分 析 ， 但 是 不 需要 同时 纠结 于 它 的 底层 细节 。 

3. 一 个 方便 易 用 的 图 形 化 可 移植 类 库 。 使 用 C++ 作为 教学 语言 的 一 个 问题 是 标准 类 库 不 
提供 图 形 化 功能 。 而 本 书 自 带 了 一 个 免费 发 布 的 开源 类 库 一 一 Standford C++ 类 库 ， 它 提供 了 
一 种 进行 图 形 交互 的 简单 且 宜 教 宜 学 的 方法 。Standford C++ 类 库 还 包括 集合 类 的 简化 实现 ， 
它 支 持 一 个 更 逻辑 化 且 更 加 有 效 的 表示 规则 。 


补充 资源 ” 


对 于 学 生 


在 Pearson 网 站 (http://www.pearsonhighered.com/ericroberts/) 上 ， 读 者 可 下 载 以 下 资源 : 
1. 书 中 每 个 示例 程序 的 源 代码 文件 

2. 运行 示例 的 全 彩 PDF 版 本 

3. 复习 题 的 答案 


对 于 教师 


在 Pearson 网 站 上 ， 有 资格 的 教师 可 下 载 以 下 资源 : 
1. 书 中 每 个 示例 程序 的 源 代码 文件 

2. 运行 示例 的 全 彩 PDF 版 本 

3. 复习 题 的 答案 

4. 编程 习题 的 答案 

5. 每 章 的 PowerPoint 课件 


Stanford C++ 类 库 


Stanford C++ 类 库 作 为 开源 的 开发 项 目 可 以 免费 获得 。 头 文件 、 编 译 库 和 源 代 人 码 可 以 
通过 GitHub (http://www.github.com/eric-roberts/StanfordCPPLib) 或 从 作者 的 个 人 网 站 (http:/ 
cs.stanford.com/-eroberts/StanfordCPPLib) 获得 。 
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Programming Abstractions in C++ 


C++ 概述 


计划 来 自 这些 不 同 实践 。 这 是 我 们 的 经 验 : 计划 不 会 从 一 个 人 或 两 个 人 ， 比 如 我 们 的 头 
脑 中 产生 ， 而 是 来 自 日 常 的 工作 中 。 
一 一 斯 托 ， 卡 迈克 尔 (Stokely Carmichael) 和 查尔斯 汉 “， FRM 
(Charles V. Homilton),《 黑 人 权利 》(Black Power), 1967 


在 刘易斯 . 卡 罗 尔 的 《爱丽 丝 梦 游 仙境 》(Alice’s Adventures in Wonderland) 中 ， 国 王 向 
小 白 兔 说 道 :“ 从 起 点 开始 ， 然 后 继续 一 直到 目的 地 ， 最 后 停止 。” 这 是 一 个 非常 好 的 忠告 ， 
但 仅 限 于 你 从 起 点 处 开始 。 本 书 设 计 为 计算 机 科学 的 第 二 门 课 程 教材 ， 并 且 假 设 你 已 经 开始 
了 程序 设计 的 学 习 。 同 时 ， 由 于 第 一 门 课程 重点 在 于 它 所 覆盖 的 内 容 ， 因 此 ， 对 于 一 本 教材 
的 作者 而 言 ， 很 难 依赖 于 你 已 掌握 的 任何 材料 。 例 如 ， 你 们 中 的 一 些 人 可 能 已 经 从 其 他 密切 
相关 的 语言 (如 C 或 Java 语言 ) 的 编程 经 验 中 理解 了 C++ 的 控制 结构 。 然 而 ， 对 另外 一 些 
人 而 言 ，C++ 的 结构 对 他 们 来 讲 是 不 熟悉 的 。 由 于 读者 的 知识 背景 不 同 ,. 因 此， 最 好 的 方法 
就 是 采用 上 述 国王 的 忠告 。 因 此 ， 本 章 将 从 起 点 开始 ,并且 向 你 介绍 写 一 个 简单 的 C++ 程 
序 所 必需 的 那些 部 分 。 


1.1 你 的 第 一 个 C++ 程序 


正如 在 下 一 节 你 将 要 学 习 到 的 一 样 ，C++ 语言 是 极其 成 功 的 诞生 于 上 世纪 70 年 代 初 
的 C 语言 的 一 种 扩展 。 在 C 语言 的 定义 文档 :《 C 程序 设计 语言 》 SER - 柯 林 汉 (Brian 
Kernighan) 和 丹尼斯 * 里 奇 (Dennis Ritchie) 在 第 1 章 开 头 便 给 出 了 以 下 建议 : 
学 习 一 种 新 的 程序 设计 语言 的 唯一 途径 就 是 用 它 编 写 程 序 。 对 于 所 有 编程 语 
言 ， 写 出 的 第 一 个 程序 都 是 一 样 的 : 
打印 以 下 单词 ; 


hello,world 


初学 语言 时 ， 这 是 一 个 很 大 的 障碍 。 要 越过 此 障碍 ， 首 先 人 必须 创建 程序 文本 ， 
然后 成 功 地 对 它 进行 编译 ， 并 加 载 、 运 行 ， 
最 后 再 查看 它 所 产生 的 输出 结果 。 只 有 掌握 ^ 
了 这 些 操作 细节 ， 剩 下 的 就 比较 容易 了 。 


* This file is adapted from the example 


如 果 你 用 C++ BS - Hello World " 程序 ， ec * on page 1 of Kernighan and Ritchie's 


* book The C Programming Language. 
ny 


可 能 最 终 看 起 来 像 图 1-1 中 的 代码 。 
此 时 ， 最 重要 的 不 是 完全 理解 上 述 程序 每 一 Se 

行 是 什么 意思 ， 因 为 之 后 会 有 足够 的 时 间 去 掌握 | inde 

这 些 细节 。 你 的 任务 (你 应 该 决定 是 否 接 受 它 ) 是 = 

让 HelloWorld 程序 运行 起 来 。 像 图 1-1 中 一 样 |} 

准确 地 输入 程序 ， 然 后 弄 清 楚 你 要 怎样 才能 使 它 图 1-1 "Hello World" £f 
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工作 。 你 需要 使 用 的 确切 步骤 取决 于 用 来 创建 并 运行 C++ 程序 的 编译 环境 。 如 果 用 本 书 作 
为 课程 的 教科 书 ， 你 的 老师 会 为 你 提供 所 需 的 一 些 关 于 编译 环境 的 参考 资料 。 如 果 你 正在 阅 
读本 书 ， 无 论 你 使 用 的 是 哪 种 C++ 编译 环境 ， 你 都 需要 参考 编译 环境 所 附带 的 文档 。 

当 你 把 所 有 这 些 细节 解决 后 ， 你 应 该 在 电脑 屏幕 上 的 一 个 窗口 中 看 到 Helloworld fé 
序 的 输出 。 在 我 准备 这 本 书 的 Apple Macintosh 电脑 上 ， 和 输出 窗口 看 起 来 如 下 图 所 示 : 


12217 a a 
hello, world 





在 你 的 电脑 上 ， 输 出 窗口 可 能 会 有 些 不 同 ， 除 了 程序 的 “hello, world” 问 候 外 ， 可 能 
还 会 包含 一 些 额 外 的 状态 消息 。 但 “hello, world” 消 息 一 定 会 输出 。Kernighan 和 Ritchie 
说 道 :“ 其 他 一 切 都 是 相对 容易 的 ”虽然 这 也 许 不 是 真 的 ， 但 是 你 会 取得 一 个 重要 的 进展 。 


12 C++ 的 历史 


早期 的 计算 机 ， 程 序 采用 机 器 语言 ( machine language) 编写 而 成 ， 机 器 语言 是 机 器 的 基本 
指令 ， 它 可 以 直接 被 计算 机 执行 。 但 用 机 器 语言 编写 的 程序 难以 阅读 ， 主 要 是 因为 机 器 语言 
结构 是 针对 机 器 硬件 而 不 是 针对 程序 员 的 需要 设计 的 。 更 糟糕 的 是 ， 每 种 计算 机 硬件 都 有 它 
自己 的 机 器 语言 ， 这 就 意味 着 在 一 台 机 器 上 编写 的 程序 不 能 在 其 他 类 型 的 计算 机 硬件 上 运行 。 

20 世纪 50 年 代 中 期 ， 在 IBM AY 24 98; - 巴克 斯 的 领导 下 的 一 组 程序 员 有 了 深刻 改 
变 计 算 性 质 的 想法 。 巴 克 斯 和 他 的 同事 猜想 : 编写 垦 有 试图 计算 数学 公式 的 程序 并 让 计 
算 机 将 这 些 公 式 自 动 转换 成 机 器 语言 是 否 可 行 ? 1955 年 ， 该 团队 创造 出 了 FORTRAN 
( formula translation 名 字 的 缩写 ) 的 最 初版 本 ， 这 是 第 一 个 高 级 程序 设计 语言 (higher-level 
programming language) 的 范例 。 

从 那 以 后 ,发 明了 许多 新 的 程序 设计 语言 ， 大 多 数 都 是 基于 已 有 的 程序 设计 语言 ， 并 以 
演化 的 方式 创建 出 新 的 语言 。C++ 代表 了 其 演化 中 连接 的 两 个 分 支 。 其 中 一 个 先祖 是 C 语 
言 ，C 语言 是 在 1972 年 由 贝尔 实验 室 的 丹尼斯 * 里 奇 设计 的 ， 随 后 在 1989 年 被 美国 国家 标 
准 协会 (ANSI) 修订 并 标准 化 。 然 而 ，C++ 也 是 那些 支持 不 同 编程 风格 的 程序 设计 语言 家 族 
的 后 继 ， 并 在 近年 来 已 对 软件 开发 产生 了 巨大 的 影响 。 


1.2.1 面向 对 象 范 型 

ir 20 年 来 ， 计 算 机 科学 和 编程 都 经 历 了 一 些 变革 。 像 大 多 数 变革 一 样 ， 托 马 斯 ， 库 恩 
在 1962 年 出 版 的 《科学 革命 的 结构 》 这 本 书 中 描写 到 : 无 论 是 政治 巨变 还 是 概念 重组 ， 新 
观点 将 推动 改变 ， 并 挑战 目前 存在 的 正统 观点 。 开 始 ， 两 种 观点 竞争 ， 至 少 在 短期 内 ， 旧 的 
观点 占据 主要 的 地 位 。 随 着 时 间 的 流逝 ， 强 大 、 流 行 的 新 观点 成 长 起 来 ， 直 到 它 开 始 取 代 旧 
的 观点 为 止 ， 库 恩 把 这 叫做 范 型 转移 (paradigm shift) 。 在 编程 中 ， 较 早 的 程序 设计 范 型 是 
过 程 程序 设计 范 型 (procedural paradigm)， 该 范 型 的 程序 是 由 主 程序 和 对 数据 进行 操作 的 若 
干 函 数 构成 。 新 的 范 型 称 之 为 面向 对 象 范 型 ( object-oriented paradigm)， 该 范 型 的 程序 被 看 
做 是 由 体现 其 特定 特征 和 行为 的 一 组 数据 对 象 构 成 。 

面向 对 象 编 程 并 不 是 一 个 新 观点 。 第 一 个 面向 对 象 语言 是 SIMULA, ， 该 语言 是 对 编码 
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的 仿真 ， 它 是 在 1967 年 由 斯 堪 的 纳 维 亚 的 计算 机 科学 家 奥 利 ' 2415389 - 达尔 (Ole-Johan) 和 
克利 斯 登 . 奈 加 特 ( Kristen Nygaard) 设计 发 明 的 。SIMULA 的 设计 非常 超前 ， 它 预见 到 了 
许多 后 来 在 编程 中 变 得 常见 的 观点 ， 包 括 抽象 数据 类 型 和 很 多 现代 的 面向 对 象 范 型 。 事 实 
E. 很 多 用 来 描述 面向 对 象 语言 的 术语 都 来 自 于 1967 年 SIMULA 的 原始 报告 。 

遗憾 的 是 ， 在 SIMULA 诞生 之 后 的 很 多 年 里 ，SIMULA 并 没有 引起 大 量 的 兴趣 。 第 一 
个 在 计算 机 专业 范围 内 具有 意义 的 面向 对 象 语 言 是 Smalltalk， 它 是 由 20 世纪 70 年 代 晚 期 
施乐 公司 的 帕 洛 阿尔 托 研究 中 心 开 发 的 。 该 语言 的 目的 在 阿 焦 尔 . 戈 德 堡 (Adele Goldberg) 
HKE - BARRE (David Robson) MEK K Smaltalk-80 : 语言 及 其 实现 》( Smaltalk-80: The 
Language and Its Insplementation) 一 书 中 进行 了 描述 ， 它 让 更 多 的 人 接触 到 了 编程 。 就 这 点 
而 言 ，Smalltalk 是 施乐 公司 巨大 努力 的 一 部 分 ， 它 提升 了 现代 用 户 界面 技术 ， 而 这 些 技术 
已 成 为 当今 个 人 电脑 的 标准 。 

尽管 吸引 人 的 特点 和 具有 高 度 交 互 性 的 用 户 环境 让 编程 过 程 更 简单 ， 但 Smalltalk 并 没 
有 取得 商业 上 的 成 功 。 只 有 当 它 的 核心 思想 被 纳入 并 变 成 工业 标准 C 语言 的 变种 后 ， 同 行 
才 对 面向 对 象 编程 感 兴趣 。 虽 然 有 几 个 类 似 的 工作 来 设计 一 个 基于 C 的 面向 对 象 程序 设计 
语言 ， 最 成 功 的 语言 是 20 世纪 80 年 代 早 期 由 AT&T 贝尔 实验 室 的 本 贾 尼 ' 斯 特 劳 斯 特 卢 
if (Bjarne Stroustrup) 发 明 的 C++. C++ 兼容 C 标准 ， 这 使 现 有 的 C 程序 以 一 种 循序 渐进 、 
演化 的 方式 统一 到 C++ 代码 中 成 为 可 能 。 

尽管 面向 对 象 程序 设计 语言 在 面向 过 程 语 言 的 扩展 中 已 十 分 流行 ， 但 它 把 面向 对 象 和 面向 
过 程 范 型 看 作 是 互 斥 的 ， 这 可 能 是 一 个 错误 。 程 序 设计 范 型 并 非 没 有 很 多 竞争 ， 但 它们 是 互补 
的 。 面 向 对 象 和 面向 过 程 范 型 (连同 其 他 重要 的 范 型 ， 比 如 在 LISP 中 表现 的 函数 编程 范 型 ) 
在 实践 中 都 有 重要 的 应 用 。 即 使 在 单个 应 用 的 背景 下 ， 你 也 可 能 会 发 现 使 用 了 不 止 一 种 方法 。 
作为 一 名 程序 员 ， 你 必须 掌握 不 同 的 范 型 ， 这 样 你 才能 使 用 合适 的 模型 去 完成 当前 的 任务 。 


1.2.2 C++ 的 演化 


像 人 类 语言 一 样 ， 程 序 设 计 语言 也 随 着 时 间 的 推移 发 生 着 改变 。 多 年 来 ，C++ 已 经 逐步 
发 展 以 满足 用 户 不 断 变化 的 需求 。 国 际 标准 化 组 织 (ISO) 一 直 在 管理 C++ 新 版 本 的 发 布 ， 
EE 1998 年 、2003 年 和 2011 年 分 别 修订 了 C++ 语言 中 的 若干 重要 问题 。 最 新 的 修订 版 称 
为 C++11， 它 引进 了 很 多 新 特性 ， 包 括 若干 让 C++ 更 容易 学 习 的 特性 。 

尽管 每 个 人 在 某 一 时 刻 会 用 到 C++11 提供 的 很 多 特性 ， 可 是 很 多 编译 器 还 不 支持 C++ 
11 标准 。 在 主要 的 编译 器 版 本 可 以 使 用 C++ 11 之 前 ， 你 可 能 不 得 不 遵循 2003 年 出 台 的 旧 
C++ 标准。 本 书 会 在 合适 的 时 候 介绍 C++11 的 特性 ， 但 是 通常 会 概述 用 旧 的 编译 器 实现 相 
同 结果 的 策略 。 


1.3 ”编译 过 程 


当 你 用 C++ 编写 一 个 程序 时 ， 第 一 步 是 创建 一 个 源 文件 ( source file)， 该 文件 由 程序 
文本 构成 。 在 运行 程序 之 前 ， 你 需要 将 源 文 件 转化 为 其 可 执行 的 格式 ， 它 需要 调用 被 称 为 
编译 器 (compiler) 的 程序 。 编 译 器 将 源 文件 转化 为 含有 相应 的 机 器 语言 指令 的 目标 文件 
C object file)。 该 目标 文件 连同 其 他 目标 文件 一 起 生成 一 个 可 以 在 系统 中 运行 的 可 执行 文件 
(executable file)。 这 些 目 标 文件 典型 得 包括 预定 义 的 称 之 为 库 ( library) 的 目标 文件 ， 它 包 
含 机 器 语言 指令 用 以 程序 所 需 的 各 种 各 样 的 通用 操作 。 把 所 有 多 个 目标 文件 组 合成 一 个 可 执 





行文 件 的 过 程 称 为 链接 (linking)。 上 述 编译 过 程 中 的 各 步骤 由 图 1-2 表示 说 明 。 
目标 文件 





图 1-2 编译 过 程 


正如 本 章 早 些 时 候 讨 论 过 的 Helloworld 程序 ， 在 编译 过 程 中 ,特殊 的 细节 随机 器 不 
同 而 有 所 变化 。 没 有 哪 一 本 教科 书 会 像 本 书 这 样 确切 地 告诉 你 应 该 用 什么 命令 让 你 的 程序 在 
你 的 系统 中 运行 。 好 消息 是 C++ 程序 它们 看 起 来 都 一 样 。 用 高 级 语言 像 C++ 编程 的 一 个 优 
点 是 它 允 许 你 忽略 硬件 的 不 同 特性 ， 且 创建 的 程序 能 够 在 很 多 不 同 的 机 器 上 运行 。 


14 C++ 程序 结构 


感受 C++ 程序 设计 语言 的 最 好 方法 是 研究 一 些 示 例 程序 ， 在 你 理解 C++ 语言 的 细节 之 
前 。 这 个 HelloWworld 程序 是 一 个 开始 ， 但 是 它 太 简单 了 ， 因 此 在 这 个 程序 里 它 不 能 包含 
很 多 你 想 看 到 的 语言 特性 。 因 为 这 本 书 适用 于 计算 机 科学 中 第 二 门 课程 ， 你 几乎 一 定编 写 过 
程序 ， 读 取 了 用 户 的 输入 ， 用 变量 存储 数值 ， 使 用 循环 来 执行 重复 计算 ， 并 使 用 辅助 函数 来 
MEEF KA. HelloWorld 程序 没有 做 上 述 这 些 事情 。 为 了 说 明 更 多 的 C++ 特性 ， 图 1-3 
给 出 了 一 个 程序 源码 ， 它 计算 输出 2 的 究 ， 并 且 包 含 描述 该 程序 各 个 部 分 的 一 些 注释 。 

当 你 运行 图 1-3 所 示 的 PowersOfTwo 程序 时 ,计算 机 首先 会 询问 你 指数 的 限制 ， 即 指 
定 该 程序 应 产生 2 的 多 少 次 方 。 例 如 你 输入 8， 程序 会 产生 一 系列 2 的 0 到 8 次 方 的 值 ， 如 
下 图 所 示 : 
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* 

j^ File: PowersOfTwo.cpp | 

$ en ne a ce ee ae e nen en id me See ee ee ae one = 

* This program generates a list of the powers of | 程序 注释 

* two up to an exponent limit entered by the user. 

*/ 

« 

ornate 上 包含 的 库 文件 
/* Function prototypes */ 

int raiseToPower(int n, int k); ) 函数 原型 


/* Main program */ 


int main() { 
int limit; 
cout «« "This program lists powers of two." «« endl; 
cout «« "Enter exponent limit: "; 
cin »» limit; 
for (int i = 0; i <= limit; i++) ( 
cout << "2 to the " << i << "=" 
<< raiseToPower(2, i) << endl; 


主 程序 


return 0; 


) 
/* 


* Function: raiseToPower 
* Usage: int p - raiseToPower(n, k); 函数 注释 


* Returns the integer n raised to the kth power. 
*y 


int raiseToPower(int n, int k) { 
int result - 1; 

for (int i = 0; i < k; i++) ( 
result *= n; 


函数 定义 


return result; 


图 1-3 C++ 程序 结构 


计算 机 屏幕 会 显示 你 执行 PowersofTwo 程序 的 运行 结果 。 屏 幕 所 显示 的 程序 运行 结 
果 被 称 为 示例 运行 (sample run)。 在 每 个 示例 运行 时 ， 用 户 的 输入 呈现 明亮 的 颜色 以 便 你 在 
程序 中 将 输入 数据 和 输出 数据 区 分 开 。 

正如 图 1-3 中 的 注释 所 展示 的 那样 ，PowersofTwo 程序 可 划分 为 多 个 部 分 ， 在 下 面 的 
章节 中 我 们 会 讨论 它们 。 


1.4.4 注释 


图 1-3 中 的 程序 有 很 多 由 英文 注释 构成 的 文本 。 注 释 (comment) 是 被 编译 器 忽略 的 文 
本 ,但 注释 会 将 程序 的 相关 信息 传递 给 程序 员 。 一 个 注释 是 由 符号 /* 和 */ 括 起 来 的 文本 
组 成 ， 它 允许 有 多 行 。 另 外 ， 你 也 可 以 采用 单行 注释 ， 这 种 注释 以 字符 // 开始 ， 直 至 该 行 
的 结束 为 止 。 除 了 当 注 释 标 志 着 一 个 程序 还 未 完成 ， 本 书 使 用 多 行 /*…*/ 的 注释 方式 ， 这 
种 策略 使 得 我 们 更 易于 发 现 一 个 程序 未 完成 的 部 分 。 

正如 你 在 图 1-3 中 看 到 的 那样 ， 程 序 PowersOfTwo 包含 一 个 在 开始 用 来 对 程序 整体 
进行 描述 的 注释 ， 以 及 在 raiseToPower 函数 定义 之 前 对 其 功能 进行 更 详细 描述 的 一 个 注 
释 。 另 外 ， 这 个 程序 还 包括 一 对 单行 注释 ， 它 们 扮演 着 英文 文本 节 标 题 的 角色 。 





14.2 包含 的 库 文件 


现代 程序 不 用 库 (library) 是 无 法 编写 的 ， 库 是 提前 编写 的 能 执行 有 用 操作 的 工具 的 集 
Ao CH 定义 了 几 个 标准 库 ， 其 中 最 重要 的 是 输入 输出 流 ( iostream )， 这 个 库 定 义 了 一 组 简 
单 的 称 之 为 流 (stream) 的 数据 结构 的 输入 输出 操作 ， 流 是 用 来 管理 流入 数据 源 或 从 数据 源 
发 出 信息 流 (如 控制 台 或 文件 ) 的 一 种 数据 结构 。 

要 想 使 用 iostream 库 ， 你 的 程序 必须 包含 这 一 行 : 


#include <iostream> 


这 一 行 指示 C++ 编译 器 从 头 文件 (header file) 中 读 取 相 关 的 定义 。 这 行 的 一 对 尖 括 号 
表示 该 头 文件 是 C++ 标准 中 的 一 个 系统 库 。 从 第 2 章 开 始 ， 你 将 会 有 使 用 你 自己 编写 或 从 
其 他 库 中 获取 头 文件 的 需求 。 这 些 典 型 的 头 文件 以 后 级 .h 结尾 ， 并 且 用 一 对 引号 括 起 来 以 
代替 一 对 尖 括 号 。 

在 C++ 中 ， 仅 仅 读 取 使 用 #include 所 包含 的 相应 的 头 文件 还 不 足以 让 你 访问 系统 
库 。 为 了 确保 定义 在 一 个 大 系统 中 各 个 部 分 的 程序 的 元 素 名 字 OMERA, RAEE) 不 会 
ERW, CH 的 设计 者 将 代码 段 切 分 成 称 之 为 命名 空间 (namespace) 的 结构 来 跟踪 该 结 
构 中 的 名 字 。C++ 标准 库 的 命名 空间 名 为 std， 这 意味 着 你 不 能 引用 定义 在 标准 头 文件 如 
iostream 中 的 名 字 ， 除 非 你 让 编译 器 知道 这 些 定 义 是 在 哪个 命名 空间 中 的 。 

越 来 越 多 专业 的 C++ 程序 员 通 过 在 所 有 来 自 sta 命名 空间 的 名 字 前 增加 前 级 std: : 
来 明确 指定 其 命名 空间 。 如 果 你 采用 这 种 方式 ，He1lloWor1gd 程序 的 第 一 行 会 变 成 : 

std::cout «« "hello, world" «« std::endl; 

如 果 你 想 向 专业 人 士 一 样 编码 ， 你 可 以 用 这 种 方式 。 对 一 些 刚 学 习 C++ 的 人 来 说 ， 这 
BE std: : 标记 让 程序 变 得 很 难 阅 读 ， 所 以 这 本 书 采 用 在 库 包 含 部 分 结束 后 增加 下 面 这 行 代 
码 的 方式 来 省 略 程序 中 的 sta: : 标记 : 


using namespace std; 


有 时 你 必须 牢记 标准 库 命 名 空间 中 的 完整 名 字 应 包括 std: : 前 级 ,例如 在 第 2 章 中 ， 
当 你 开始 定义 你 自己 的 库 接口 时 ， 这 就 非常 重要 。 然 而 ， 截 止 目前 ， 考 虑 使 用 下 行 代码 : 


using namespace std; 


它 可 能 是 最 容易 想到 的 魔 史 ，C++ 编译 器 需要 它 的 魔力 为 你 的 代码 工作 。 


14.3 ”函数 原型 


从 程序 功能 的 角度 上 讲 ，C++ 程序 的 计算 是 在 函数 中 进行 的 。 一 个 函数 (function) 是 
命名 为 完成 特定 功能 的 一 段 代 码 。PowersofTwo 程序 包含 两 个 函数 : EA% (main) 和 
raiseToPower 函数 ， 它 们 会 在 后 面 的 章节 进行 更 详细 的 描述 。 尽 管 这 些 函 数 的 定义 呈 
现在 PowersOfTwo 程序 源 文件 的 最 后 ,但 PowersOfTwo 程序 在 包含 的 库 文件 语句 后 对 
raiseToPower 函数 进行 了 简洁 的 描述 。 这 个 简洁 的 形式 称 为 函数 原型 ( prototype)， 它 使 
得 在 函数 实际 定义 之 前 调用 该 函数 成 为 可 能 。 

一 个 C++ 函数 原型 由 函数 定义 的 第 一 行 后 加 一 个 分 号 组 成 ， 如 以 下 函数 原型 : 


int raiseToPower(int n, int k); 


这 个 函数 原型 告诉 编译 器 当 它 去 调用 出 现在 代码 中 的 函数 所 需要 知道 的 所 有 信息 。 正 如 


CH- BEE Z 


你 将 在 第 2 章 看 到 的 函数 扩展 的 讨论 ， 这 个 函数 原型 表明 函数 将 接受 两 个 整数 作为 参数 ， 并 
把 一 个 整数 作为 返回 值 。 - 

你 必须 在 调用 函数 前 ， 对 每 一 个 函数 提供 声明 或 定义 。C++ 要 求 这 样 的 函数 原型 声明 ， 
以 使 编译 器 可 以 判断 函数 的 调用 是 否 与 函数 的 定义 兼容 。 如 果 你 不 小 心 提 供 了 错误 的 参数 数 
量 或 者 错误 的 参数 类 型 ， 编 译 器 就 会 报错 ， 以 便 你 能 很 容易 地 找到 程序 代码 中 的 错误 。 


14.4 主 程序 


每 一 个 C++ 程序 必须 有 一 个 名 为 main 的 主 函 数 。 这 个 函数 指定 了 程序 计算 的 开始 点 ， 
并 且 当 程序 开始 运行 时 ，main 函数 就 被 调用 。 当 main 函数 结束 它 的 工作 并 返回 时 ， 程 序 
的 执行 也 随 之 结束 。 

在 PowersOfTwo 程序 中 ，main 函数 的 第 一 行 是 一 个 变量 声明 (variable declaration) 
的 示例 ， 变 量 声明 服务 于 程序 对 所 使 用 到 的 值 的 存储 空间 。 在 这 个 例子 中 ， 这 一 行 引入 了 一 
个 新 变量 limit: 

int limit; 
它 可 以 存放 一 个 int 类 型 的 值 ，int 标准 类 型 代表 整数 。 变 量 声明 的 语法 之 后 会 在 “变量 ” 
一 节 进 行 详 细 的 讨论 。 现 在 你 需要 知道 的 是 : 这 个 声明 为 一 个 整 型 变量 创建 了 存储 空间 ， 你 
可 以 在 main 函数 中 使 用 这 个 空间 。 

main 基数 中 第 二 行 是 : 


cout «« "This program lists powers of two." << endl; 


这 一 行 跟 HelloWorld 中 的 声明 有 相同 的 作用 ， 它 向 用 户 发 送 一 条 消息 来 表明 程序 的 功能 。 
标识 符 cout 被 称 为 控制 台 输 出 流 (console output stream)， 控 制 台 输出 流 是 由 iostream 
输入 输出 流 接口 定义 的 。 这 个 声明 的 作用 是 将 字符 引号 之 间 的 字符 串 发 送 到 cout 流 中 ， 并 
伴随 着 行 结束 符 endl. endl 确保 下 一 个 输出 操作 会 从 新 的 一 行 开 始 。 

接 下 来 的 两 行 代码 要 求 用 户 输入 变量 limit 的 值 。 以 下 代码 行 : 


cout «« "Enter exponent limit: " 


仍然 是 向 cout 流 打 印 一 条 消息 ， 就 像 第 一 行 所 做 的 一 样 。 这 行 代码 的 目的 是 让 用 户 知道 需 
要 何 种 类 型 的 输入 值 。 这 种 消息 一 般 被 称 为 提示 ( prompt)。 当 你 打印 一 个 要 求 用 户 输入 的 
提示 时 ， 传 统 上 会 省 略 end] 的 值 ， 以 便 这 个 提示 与 用 户 输入 能 出 现在 同一 行 。 当 计算 机 执 
行 到 程序 的 这 行 代码 时 ,计算机 会 显示 提示 ， 并 将 控制 台 光 标 (闪烁 的 竖 线 或 方块 ) 移 到 当 
前 的 输入 位 置 上 ( 即 在 这 行 的 最 后 ) 以 等 待 用 户 的 输入 ， 如 下 图 所 示 : 


This program lists E WE of two. 
Enter exponent limit: | 





对 输入 值 实际 请 求 的 是 以 下 这 行 代码 : 
cin >> limit; 


标识 符 cin 代表 控制 台 输 入 流 (console input stream), XI cout 用 于 从 用 户 那 里 读 入 数 


8 1# 





据 。 这 条 声明 表明 下 一 个 来 自 cin 流 的 值 应 该 赋 给 变量 1imit。 然 而 ， 由 于 limit 被 声 
明 为 一 个 整 型 变量 ， 操 作 符 >> 会 自动 地 将 用 户 输入 的 字符 类 型 的 值 转化 为 相应 的 整数 值 。 
因此 ， 当 用 户 输入 8 并 按 回 车 键 后 ， 程 序 的 执行 效果 是 将 8 赋 给 limit 变量 。 

主 函 数 的 下 一 行 是 一 个 for 语句 ， 其 功能 为 重复 执行 一 个 代码 块 。 像 C++ 中 所 有 的 控 
制 语句 一 样 ，for 语句 被 分 为 定义 控制 操作 性 质 的 标题 行 (header line) 和 表明 控制 操作 影 
响 哪些 语句 的 循环 体 (body) 构成 。 该 程序 中 的 for 语句 所 对 应 的 上 述 划 分 如 下 所 示 : 


for (int i = 0; i <= limit; i++) ( ) 标题 行 
cout << "2 to the " << i«« "=" 


循环 体 


<< raiseToPower(2, i) << endl; 


) 
在 本 章 之 后 的 “ for 语句 ”一 节 中 ， 你 会 有 机 会 更 详细 地 理解 标题 行 。 标 题 行 表明 无 论 循 
环 体 中 的 语句 是 什么 ， 应 该 重复 每 一 个 i 值 ， 从 0 开始 持续 增 至 Limit, 包括 limit. ff 
环 体 的 每 一 次 执行 都 输出 显示 一 行当 前 变量 i 值 所 对 应 的 2 的 值 。 

循环 体 中 的 这 条 语句 是 : 


cout << "2 to the " << i << "=" 
«« raiseToPower(2, i) «« endl; 


这 条 语句 表明 了 两 点 。 第 一 ， 语 句 可 以 跨越 多 行 ， 分 号 是 语句 结束 的 标志 符 ， 而 非 简单 的 每 
行 的 结尾 。 第 二 ， 这 条 语句 展示 了 cout 流 链接 多 个 输出 值 及 将 数字 转换 成 可 输出 形式 的 能 
力 。 该 输出 的 第 一 部 分 是 以 下 字符 序列 : 


2 to the 


随后 输出 的 是 变量 :的 值 ， 含 有 左右 各 一 个 空格 的 等 号 ， 函 数 调用 


raiseToPower(2, i) 


的 值 及 最 后 行 结束 标志 符 。 字 符 中 的 空格 可 确保 数值 不 会 连接 在 一 起 。 

在 程序 可 以 打印 输出 行 之 前 ， 它 必须 调用 raiseToPower 函数 以 查看 其 值 是 什么 。 调 用 
raiseToPower 会 挂 起 main 函数 的 执行 ， 直 到 main 函数 收 到 调用 函数 的 返回 值 为 止 。 

与 函数 的 典型 情况 一 样 ，raiseToPower 需要 从 主 程序 main 中 获取 某 些 信息 以 完成 
它 的 工作 。 如 果 你 考虑 增 大 一 个 数 到 寡 所 涉及 的 信息 ， 你 会 很 快意 识 到 raiseToPower 
函数 需要 知道 基数 和 指数 ， 在 该 实例 中 基数 是 常数 2， 指 数 是 当前 存放 在 变量 i 中 的 
值 。 然 而 ， 这 个 变量 是 在 main 函数 体内 声明 的 ， 只 能 在 main 函数 体内 访问 。 如 果 
raiseToPower 要 获得 基数 和 指数 值 ， 主 程序 必须 通过 把 它们 放 在 函数 名 后 的 圆 括 号 里 ， 
将 它们 作为 参数 传递 到 raiseToPower 函数 中 。 我 们 将 在 下 一 节 讲 授 如 何 将 这 些 值 复制 到 
相应 的 函数 参数 。 

在 HelloWorld 程序 中 ，main 函数 的 最 后 一 条 语句 是 : 


return: 0; 


这 条 语句 表明 main 函数 的 返回 值 是 0。 为 方便 起 见 ，C++ 采用 main 函数 的 返回 值 来 报告 
整个 程序 的 状态 。0 值 表示 成 功 ， 其 他 值 表示 失败 。 


1.4.5 ”函数 定义 
因为 较 大 的 程序 很 难 完全 理解 ， 因 此 ， 大 多 数 程序 被 划分 成 几 个 较 小 的 更 易于 理解 的 消 
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数 。 在 程序 PowersOfTwo F, PI raiseToPower 是 求 一 个 整数 的 寡 (C++ 中 没有 内 置 
该 操作 )， 因 此 ， 它 必须 被 明确 地 定义 。 
raiseToPower 清 数 的 第 一 行 是 以 下 变量 声明 语句 : 


int result = 1; 


该 声明 引入 了 一 个 新 的 变量 result， 它 可 以 存放 int 类 型 的 值 ， 并 且 将 result 初始 化 为 1。 
函数 中 的 第 二 条 语句 是 一 个 类 似 于 你 在 主 函 数 中 见 到 的 for 循环 ， 它 执行 循环 体 k 次 。 
for 循环 的 循环 体 由 下 面 这 条 语句 构成 : 


result *- n; 


该 语句 是 C++ 对 英文 句子 "Multiply result by n"( result 乘 以 n) 的 缩写 。 因 为 函数 初始 
化 result 的 值 为 1， 之 后 result RU n AT kh, 因此， 变量 result 最 后 的 值 是 nx。 
raiseToPower 函数 的 最 后 一 条 语句 是 : 


return result; 
该 语句 表明 函数 应 以 result 的 值 作为 函数 的 返回 值 。 


15 变量 


在 一 个 程序 中 的 数值 通常 要 存储 在 变量 ( variable) 中 ， 它 是 一 个 命名 的 能 够 存储 特定 
类 型 值 的 一 块 内 存 区 域 。 你 已 经 在 程序 PowersofTwo 中 看 到 了 变量 的 实例 ， 也 肯定 已 
经 通过 你 早期 的 编程 经 历 熟悉 了 变量 的 基本 概念 。 本 节 的 目的 是 概括 C++ 中 的 变量 使 用 
规则 。 


1.5.1 ”变量 声明 


在 C++ 中 ， 你 必须 在 使 用 变量 前 对 其 进行 声明 ( declare)。 声 明 变 量 的 主要 功能 是 将 变 
量 的 名 字 和 变量 包含 的 值 的 类 型 关联 起 来 。 变 量 声明 在 程序 中 的 位 置 也 决定 了 变量 的 作用 域 
(scope)， 它 是 一 个 变量 能 访问 的 区 域 。 

常用 的 声明 变量 的 语法 是 : 


type namelist ; 


Hh, type 表明 变量 的 类 型 ， 而 namelist 是 变量 名 列表 ， 变 量 名 之 间 用 逗号 分 隔 。 在 大 多 数 
情况 下 ， 每 个 声明 引入 一 个 变量 名 。 例 如 ，PowersofTwo 程序 中 的 main 函数 以 这 行 代码 
开始 : 

int limit; 
它 声 明 变 量 1imit 是 整数 类 型 。 然 而 ， 你 也 可 以 一 次 声明 几 个 变量 ， 就 像 下 面 声 明了 名 字 
为 nl1、n2、n3 的 三 个 变量 一 样 : 

double nl, n2, n3; 


在 上 述 例子 中 ， 每 个 变量 都 声明 为 double 类 型 ( 它 是 C++ 中 用 来 表示 有 小 数 部 分 的 数 
IEA), double 是 双 精 度 浮 点 ( double-precision floating-point) 的 缩写 ， 但 没 必 要 担 
心 所 有 这 些 术 语 的 含义 。 这 个 声明 出 现在 图 1-4 所 示 的 程序 AddThreeNumber 中 ， 程 序 
AddThreeNumber 的 功能 是 读 取 三 个 数 ， 并 计算 输出 它们 之 和 。 
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* File: AddThreeNumbers.c 


人 hn program adds three floating-point numbers and prints their sum. 
* 

#include <iostream> 

using namespace std; 


int main() { 
double nl, n2, n3; 


cout << "This progran adds three numbers." << endl; 
cout << "Ist n -" 
cin »» nl; 


cout «« "2nd number: "; 

cin »» n2; 

cout «« "3rd number: "; 

cin >> n3; 

double sum = nl + n2 + n3; 

cout «« "The sum is " «« sum «« endl; 
return 0; 





图 1-4 三 个 数 相 加 的 程序 


重要 的 是 需 牢 记 : 在 变量 的 生存 期 内 ， 所 有 变量 的 名 字 和 其 类 型 都 是 保持 不 变 的 ， 但 变 
量 的 值 一 般 会 随 着 程序 的 运行 而 发 生 改变 。 为 了 强调 变量 值 的 动态 特性 ， 常 常 将 变量 示意 成 
一 个 盒子 ， 变 量 的 名 字 像 盒子 的 标签 出 现在 盒子 外 面 ， 变 量 的 值 出 现在 盒子 里 面 。 例 如 ， 你 
可 以 看 到 limit 声明 示意 图 如 下 所 示 : l 


limit 


RA limit 的 值 会 覆盖 盒子 里 之 前 的 内 容 ， 但 是 不 会 改变 它 的 名 字 和 类 型 。 

在 C++ 中 ， 变 量 初 值 是 没有 被 定义 的 。 如 果 你 想 让 一 个 变量 有 一 个 特定 的 初 值 ， 你 需 
要 对 它 进行 明确 地 初始 化 。 为 此 ， 你 需要 做 的 是 在 变量 名 后 面 加 上 一 个 等 号 和 变量 的 初 值 。 
因此 ， 以 下 声明 : 


int result = 1; 


是 下 面 这 段 将 声明 和 赋 初 值 分 开 的 代码 的 简写 : 


int result; 


result = 1; 


初始 值 作为 声明 的 一 部 分 称 为 初始 化 (initializer) o 


1.5.2 ”命名 规则 


变量 、 函 数 、 类 型 、 常 量 等 名 字 统 称 为 标识 符 (identifier)。 在 C++ 中 ， 标 识 符 的 构造 
规则 为 : 

1. 名 字 必 须 以 一 个 字母 或 者 是 下 划 线 “_ ”开始 。 

2. 名 字 中 的 所 有 字符 必须 是 字母 、 数 字 或 者 是 下 划 线 。 不 允许 包含 空格 或 者 其 他 特殊 的 字符 。 

3. 名 字 不 能 包含 表 1-1 中 所 示 的 C++ 中 的 保留 字 。 

在 标识 符 中 ,大 小 写字 母 被 认为 是 不 同 的 。 因 此 ， 名 字 ABC 和 abc 是 不 同 的 。 标 识 符 
可 以 取 任 意 长 度 , 但 C++ 编译 器 不 会 考虑 任何 超过 31 个 字符 的 两 个 名 字 是 否 相同 。 

你 可 以 通过 采用 规则 的 标识 符 以 帮助 读者 识别 其 功能 来 改进 你 的 编程 风格 。 在 本 节 中 ， 
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变量 和 函数 的 名 字 都 是 以 小 写字 母 开 头 ， 如 limit 和 raiseToPower。 类 和 其 他 编程 者 定 
义 的 数据 类 型 的 名 字 以 大 写字 母 开 头 ， 如 Direction 和 TokenSscanner。 常 量 名 全 部 用 
大 写字 母 表 示 ， 如 PI 和 HRALEF_DOLLRR。 当 一 个 标识 符 由 几 个 英文 单词 构成 时 ， 通 常 的 惯 
例 是 每 个 单词 的 首 字母 大 写 ， 从 而 使 名 字 更 易于 阅读 。 因 为 这 种 命名 方式 不 适合 于 常量 ， 因 
此 ， 程 序 员 常 采用 下 划 线 字符 来 分 隔 标识 符 中 的 单词 。 


表 1-1 C++ 中 的 保留 字 


asm do inline short typeid 
auto double int signed typename 
bool dynamic cast long sizeof union 
break else mutable static unsigned 
case enum namespace static cast using 
catch explicit new struct virtual 
char extern operator switch void 
class false private template volatile 
const float protected this wchar t 
const cast for public throw while 
continue friend register true 

default goto reinterpret cast try 

delete if return typedef 


1.5.3 ”局 部 变量 和 全 局 变量 


很 多 变量 声明 在 函数 体内 。 这 样 的 变量 被 称 为 局 部 变量 (local variable)。 局 部 变量 的 作 
用 域 可 以 扩展 到 它 声明 所 在 块 的 结束 。 当 函数 被 调用 时 ， 为 每 个 局 部 变量 分 配 在 整个 函数 调 
用 时 期 的 存储 空间 。 当 函数 返回 时 ， 所 有 的 局 部 变量 都 消亡 。 

若 变量 声明 出 现在 函数 定义 以 外 ， 则 这 种 声明 将 引入 一 个 全 局 变量 ( global variable). 
全 局 变量 的 作用 域 为 它 声 明 的 那个 文件 ， 并 且 其 生命 期 为 该 程序 的 整个 运行 期 。 因 此 ， 全 局 
变量 可 以 存储 函数 调用 的 值 。 虽 然 这 可 以 看 作为 有 用 的 特性 ， 但 全 局 变量 的 缺点 仍 超过 其 优 
点 。 首 先 ， 全 局 变量 可 以 被 程序 中 的 任意 函数 操作 ， 这 很 难 避 免 函 数 间 的 相互 干扰 。 由 于 函 
数 间 的 紧 看 合 总 是 带 来 问题 ， 因 此 ， 本 书 除了 声明 全 局 常量 外 ， 通 常 不 采用 全 局 变量 ， 它 们 
会 在 下 节 进 行 讨论 。 虽 然 全 局 变量 有 时 看 上 去 很 迷人 ， 但 如 果 你 避免 使 用 全 局 变量 ， 你 会 发 
现 这 样 做 会 更 易于 管理 你 程序 的 复杂 性 。 


154 ”常量 


当 你 编写 程序 时 ， 你 会 发 现 ， 在 程序 中 相同 的 常量 会 用 到 很 多 次 。 例 如 ， 如 果 让 你 编写 
一 个 有 关 圆 的 几何 计算 程序 ， 常 量 将 会 频繁 地 出 现 。 而 且 ， 如 果 这 些 计算 要 求 的 精度 很 
高 ， 这 就 意味 着 你 可 能 会 用 3.141 592 653 589 793 238 46 这 个 值 来 计算 。 一 遍 又 一 遍 输入 这 
个 常数 是 非常 枯燥 的 ， 而 且 如 果 你 每 次 都 是 手工 输入 而 不 是 复制 、 粘 贴 这 个 值 的 话 ， 就 很 有 
可 能 导致 错误 。 如 果 你 给 这 个 常量 起 一 个 名 字 并 在 程序 中 引用 该 名 会 更 好 。 当 然 ， 你 也 可 以 
像 下 行 代码 简单 地 声明 pi 为 一 个 局 部 变量 : 

double pi = 3.14159265358979323846; 

但 是 声明 之 后 你 只 能 按照 pi 被 定义 的 方式 使 用 它 。 更 好 的 策略 是 声明 一 个 全 局 的 名 为 PI 
的 常量 ， 如 下 行 代码 所 示 : 
const double PI = 3.14159265358979323846; 


在 这 声明 开始 处 的 关键 字 const 表明 该 值 被 初始 化 之 后 不 能 再 改变 ， 它 确保 了 该 值 是 
一 个 常量 。 毕 竟 下 的 值 不 太 可 能 会 改变 (尽管 事实 上 ， 在 1897 年 印第安 纳 州 议会 上 的 法 案 


16 
17 


12 RIF 





试图 做 到 了 )。 上 述 声明 的 其 他 部 分 由 类 型 、 常 量 名 和 值 构成 。 该 声明 与 其 他 声明 的 唯一 不 
同 在 于 C++ 中 常量 名 中 的 字符 为 全 部 大 写 。 

采用 命名 的 常量 有 以 下 几 个 优点 。 首 先 ， 描 述 性 常量 名 使 得 程序 更 易于 阅读 。 更 重要 的 
是 ,使 用 常数 名 可 以 大 大 简化 程序 演化 中 维护 代码 时 所 出 现 的 问题 。 尽 管 PI 的 值 不 太 可 能 
发 生 改 变 , 但 有 些 “ 常 量 ” 的 值 会 随 着 程序 的 演化 而 发 生 改 变 ， 尽 管 这 些 值 仍 为 一 个 特定 程 
序 版 本 中 的 常数 。 

历史 最 容易 说 明 上 述 原 则 的 重要 性 。 想 象 一 下 当 你 是 一 名 20 世纪 60 年 代 末 的 程序 员 ， 
正 进行 着 ARPANET 的 初期 设计 。ARPANET 是 第 一 个 大 型 的 计算 机 工作 网 络 ， 它 是 现代 互 
联网 的 前 身 。 因 为 当时 资源 非常 有 限 ， 你 需要 限制 可 以 连接 的 主机 的 数量 一 一 正如 真正 的 
ARPANET 设计 者 在 1969 年 所 做 的 那样 。 早 期 的 ARPANET 限制 连接 的 主机 数 是 127 台 。 
WR Cx 在 当时 已 经 出 现 了 ， 有 可 能 会 向 以 下 语句 那样 声明 一 个 常量 : 


const int MAXIMUM NUMBER OF HOSTS = 127; 
然而 ， 在 之 后 的 某 个 时 间 ， 网 络 的 爆炸 式 增 长 会 迫使 你 突破 连接 主机 限制 数 。 如 果 你 在 程序 
中 采用 命名 的 常量 ， 该 过 程 就 会 变 得 非常 简单 。 将 主机 数量 的 限制 增加 到 1023 ， 仅 需 像 如 
下 语句 修改 声明 即 可 : 


const int MAXIMUM NUMBER OF HOSTS = 1023; 


如 果 你 在 程序 中 每 一 处 使 用 最 大 值 的 地 方 都 使 用 了 常量 MAXIMUM NUMBER OF HOSTS, 
则 程序 会 自动 地 将 该 常量 的 旧 值 替换 为 1023。 

请 注意 ， 如 果 你 使 用 数值 字面 值 127， 情 况 则 会 完全 不 同 。 此 时 ， 你 需要 通过 搜索 整个 
程序 并 将 所 有 的 127 修改 成 更 大 的 值 。 程 序 中 的 某 些 数值 字面 值 127 可 能 并 不 代表 连接 主机 
的 限制 数 ， 此 时 至 关 重 要 的 是 不 能 改变 这 些 值 。 若 在 上 述 事 件 中 你 出 现 了 错误 ， 那 么 你 会 在 
追踪 这 些 错 误 时 非常 难过 。 


1.6 ”数据 类 型 


C++ 程序 中 的 每 个 变量 都 可 容纳 一 个 限制 于 特定 类 型 的 值 。 作 为 声明 语句 的 一 部 分 ， 你 
必须 设置 变量 的 类 型 。 到 目前 为 止 ， 你 已 经 见 过 具有 int 和 double 类 型 的 变量 , 但 是 这 
些 类 型 仅仅 是 C++ 可 用 类 型 中 的 皮毛 。 如 今 的 编程 会 用 到 很 多 数据 类 型 。 其 中 一 些 为 编程 
语言 的 内 置 类 型 ， 另 一 些 作为 特定 应 用 程序 的 一 部 分 被 定义 。 学 会 如 何 操作 各 种 类 型 的 数据 
是 掌握 任何 一 种 编程 语言 (包括 C++ 语言 ) 基础 的 必 不 可 少 的 一 部 分 。 


1.6.1 数据 类 型 的 概念 


在 C++ 中 ， 每 个 数据 值 都 有 其 相应 的 数据 类 型 。 从 形式 上 看 ， 数 据 类 型 ( data type) 由 
两 个 属性 定义 : 值 集 (domain)， 即 该 类 型 值 的 集合 ; 操作 集 (set of operation), CHM TIZ 
类 型 的 行为 。 例 如 ，int 类 型 的 值 集 为 所 有 的 整数 ， 即 
等 等 ， 直 至 机 器 的 硬件 限制 。 例 如 ， 适合 于 int 类 型 的 操作 集 包 括 标准 的 算术 运算 ， 例 如 ， 
加 法 和 乘法 。 其 他 类 型 有 其 各 自 的 值 集 和 操作 集 。 

正如 你 在 下 一 章 中 会 学 到 的 ， 很 多 类 似 于 C++ 的 现代 编程 语言 的 能 力 来 源 于 你 可 以 从 
已 存在 的 数据 类 型 定义 一 个 新 的 数据 类 型 。 为 了 启动 这 个 过 程 ，C++ 包含 几 种 基本 类 型 ， 这 
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些 基 本 类 型 作为 语言 的 一 部 分 被 定义 。 这 些 类 型 作为 类 型 系统 整体 的 建筑 块 ， 被 称 为 原子 的 
(atomic)， 即 基本 类 型 ( primitive type)。 这 些 预 定义 的 基本 类 型 分 为 5 类: 整数 类 型 、 浮 点 
类 型 、 布 尔 类 型 、 字 符 类 型 和 枚 举 类 型 它们 会 在 下 面 进行 讨论 。 


1.6.2 ”整数 类 型 


尽管 整数 的 概念 看 起 来 是 一 个 很 简单 的 概念 ， 但 实际 上 C++ 中 有 几 种 不 同 的 数据 类 型 来 表 
达 整 数值 。 在 大 多 数 情况 下 ， 你 需要 知道 的 是 int 类 型 ， 它 对 应 着 你 所 使 用 的 计算 机 系统 中 整 
数 的 标准 表示 。 然 而 ， 在 某 些 情况 下 ， 你 需要 更 加 小 心 。 像 所 有 的 数据 一 样 ，int 类 型 的 值 存 
储 能 力 有 限 。 因 此 ， 这 些 值 有 最 大 值 的 限制 ， 这 就 限制 了 你 所 使 用 的 整数 的 范围 。 为 了 解决 这 
个 问题 ，C++ 定义 了 三 种 整数 类 型 : short, int 和 long 一 一 它们 由 其 值 域 的 大 小 而 相互 区 别 。 

遗憾 的 是 ，C++ 语言 定义 中 没有 指定 这 三 种 类 型 的 确切 的 值 域 。 因 此 ， 不 同 整 数 类 型 的 
值 域 取决 于 你 所 使 用 的 机 器 和 编译 器 。 在 计算 的 初期 ，int 类 型 的 最 大 值 典型 的 是 32 767, 
以 今天 的 标准 来 看 ， 它 真是 太 小 了 。 例 如 ， 如 果 你 想 执 行 计 算 一 年 中 的 总 秒 数 ， 你 就 不 能 采 
用 那些 计算 机 的 int 类 型 量 ， 因 为 计算 结果 值 (31536 000) 要 远大 于 32767. 现代 的 机 器 
倾向 于 支持 更 大 的 整数 ， 但 是 你 只 能 依靠 以 下 特性 : 

e 当 你 将 一 个 整数 从 short 类 型 转化 成 int 类 型 再 转换 成 long 类 型 时 ， 该 整数 的 

内 存量 是 不 能 降低 的 。 例 如 ，C++ 编译 器 的 设计 者 可 以 决定 使 short 类 型 和 int 
类 型 具有 相同 大 小 的 内 存 ， 但 绝 不 会 让 int 类 型 比 short 类 型 的 内 存量 小 。 

e int 类 型 的 最 大 值 必须 至 少 为 32 767 (20-1). 

* long 类 型 的 最 大 值 必须 至 少 为 2 147 483 647 (22 -1 )。 

C++ 的 设计 者 可 以 选择 更 确切 地 定义 int 类 型 的 值 域 。 例 如 ， 他 们 可 以 像 Java 的 设计 
者 一 样 在 每 台 机 器 里 都 定义 int 类 型 的 最 大 值 为 2" -1。 这 样 他 们 就 会 很 容易 将 一 个 程序 从 
一 个 系统 移植 到 另 一 个 系统 ， 并 且 程序 的 行为 方式 不 变 。 这 种 在 不 同 机 器 之 间 移 植 程序 的 能 
力 称 为 可 移植 性 (portability)， 它 是 在 编程 语言 的 设计 中 需 重 点 考虑 的 因素 。 

在 C++ 中 ， 每 种 整数 类 型 int. long 和 short 都 可 以 在 其 类 型 名 前 加 上 关键 字 
unsigned。 增 加 unsigned 之后， 就 构建 出 了 一 种 新 的 不 允许 出 现 负 值 的 数据 类 型 。 与 
有 符号 的 整数 类 型 相 比 ， 这 种 无 符号 整数 可 以 提供 两 倍 范围 的 值 域 。 例 如 ， 在 现代 机 器 上 ， 
int 类 型 的 最 大 值 典型 的 是 2 147 483 647, fH unsigned int 类 型 最 大 值 是 4 294 967 295, 
C++ 允许 类 型 unsigned int 缩写 成 unsigned， 实 践 中 ， 大 多 数 程序 员 更 倾向 于 这 种 缩 
写 形 式 。 

一 个 整数 常量 通常 写成 一 串 十 进 制 数字 。 然 而 ， 如 果 这 个 数 以 0 开始 ， 编 译 器 会 将 这 个 
值 当 做 八进制 数 (基数 8 )。 因 此 ， 常 量 040 被 认为 是 八进制 数 ， 代 表 的 是 十 进 制 数 32。 如 
果 你 用 字符 Ox 作为 一 个 数 的 前 绥 ， 则 编译 器 会 认为 它 是 一 个 十 六 进 制 数 (基数 16 )。 因 此 ， 
常量 OxFF 代表 十 进 制 数 2355S。 你 可 以 通过 在 数字 串 后 加 工 来 显 式 地 指明 一 个 整数 常量 的 类 
型 是 1ong。 因 此 ,常量 0L 与 0 等 价 , 但 该 值 的 类 型 是 long。 同 样 ， 如 果 用 U 作为 一 个 整 
数 常 数 的 后 级 ， 该 常数 就 认为 是 一 个 无 符号 整数 。 


1.6.3 FARE 


包含 小 数 部 分 的 数 称 为 浮 点 数 ( floating-point number)， 在 数学 中 它 经 常 被 用 于 近似 实 
数 。C++ 定义 了 三 种 不 同 的 浮 点 类 型 float, double 和 1long double。 尽 管 ANSI C++ 
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并 没有 指定 这 些 类 型 的 确切 表示 ， 但 若 以 类 型 所 占 的 内 存量 的 大 小 来 考查 类 型 的 不 同 ， 则 
long double 类 型 要 比 double 类 型 长 ，double 类 型 比 float 类 型 长 (更 长 的 数据 类 
型 以 占据 更 多 的 内 存 空间 为 代价 ， 可 表示 数值 的 更 多 的 精度 )。 然 而 ， 除 非 你 是 做 严格 的 科 
学 计算 ， 和 否则 这 些 类 型 之 间 的 差异 并 不 会 很 大 。 为 了 与 C++ 程序 员 的 惯例 一 致 ， 本 书 采 用 
double 类 型 作为 浮 点 类 型 的 标准 。 

在 C++ 中 ， 浮 点 类 型 常量 用 带 有 小 数 点 的 十 进 制 表示 。 因 此 ， 若 程序 中 出 现 2.0， 则 
该 数 就 被 认为 是 一 个 浮 点 数 。 若 在 程序 中 写 的 是 2， 那 么 该 数 就 被 认为 是 一 个 整数 。 浮 点 数 
还 可 以 用 科学 计数 法 这 种 特殊 的 编程 风格 表示 ， 甚 中 数值 被 表示 为 一 个 浮 点 数 乘 以 10 的 整 
数 宕 。 用 这 种 方式 表示 一 个 浮 点 数 时 ， 首 先 写 一 个 标准 的 浮 点 数 ， 其 后 书写 字母 E 和 一 个 整 
数 指数 ， 在 整数 前 面 选 择 + 或 - 标志 。 例 如 : 光速 (单位 为 m/s) 的 C++ 表示 形式 为 : 


2.9979E+8 


HB, 卫 代 表 将 前 面 的 数字 乘 以 10 We UE 


1.6.4 布尔 类 型 

当 你 编写 程序 时 ， 常 常 需要 测试 一 个 特定 的 影响 其 代码 行为 的 条 件 。 通 常 ， 这 一 条 件 采 
用 具有 值 为 true 或 false 的 表达 式 来 表示 。 这 种 仅 具 有 合法 常量 值 true 或 false 的 数 
据 类 型 被 称 为 布尔 数据 (Boolean data) 一 一 它 是 数学 家 乔治 布尔 (George Boole) 发 明 的 
一 种 处 理 该 类 数值 的 代数 方法 。 

在 C++ 中， 布尔 类 型 名 为 bool。 你 可 以 声明 bool 类 型 的 变量 ， 并 且 像 操作 其 他 类 型 
的 量 一 样 操 作 它 。bool 类 型 适用 的 操作 将 在 “布尔 操作 符 ” 这 一 节 中 给 出 详细 描述 。 


16.5 ”字符 


早期 ， 计 算 机 被 设计 成 只 能 处 理 数值 数据 ， 因 此 那 时 计算 机 常 被 称 为 数值 计算 机 
(number cruncher)。 然 而 ， 现 代 计 算 机 更 多 处 理 的 是 出 现在 键盘 和 屏幕 上 以 字符 表示 的 任何 
信息 的 文本 ， 而 非 数值 数据 。 现 代 计算 机 处 理 文 本 数据 的 能 力 推动 了 文字 处 理 系统 、 在 线 参 
考 库 、 电 子 邮件 、 社 交 网 络 和 具有 无 限 需 求 的 各 种 令 人 兴奋 的 应 用 程序 的 发 展 。 


Ni 1-2 ASCII — 


Dus pus wer Tus Ts Tes pr T T9 T 
[vw eie [ vs | vez | veni | Vor | ves | 
[ose [rr [ome [1 f= Et pets E LC 
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文本 数据 最 基本 的 元 素 是 一 个 个 单一 的 字符 ， 一 个 字符 在 C++ 中 用 预定 义 的 基本 类 型 
char X. char 类 型 的 值 域 是 可 以 出 现在 屏幕 或 键盘 上 的 字母 、 数 字 、 空 格 、 标 点 符号 
和 回 车 键 等 字符 的 集合 。 在 机 器 内 部 ， 这 些 字符 被 表示 成 计算 机 赋 给 每 个 字符 的 数字 代码 。 
在 大 多 数 的 C++ 实现 中 ， 用 于 表示 字符 的 代码 系统 被 称 为 ASCII， 它 代表 “美国 标准 信息 
交换 码 ( American Standard Code for Information Interchange)”。ASCII 字符 集 所 对 应 的 十 进 
制 值 显 示 在 表 1-2 中 ， 任 何 字符 的 ASCII 码 值 是 该 字符 在 表 中 所 对 应 的 行 和 列 值 之 和 。 

尽管 知道 字符 的 内 部 码 值 很 重要 ,但 是 知道 一 个 数值 所 对 应 的 特定 字符 通常 更 有 用 。 当 
你 键入 字母 A， 硬 盘 上 的 硬件 逻辑 会 自动 将 字符 A 转化 成 ASCII 码 值 65， 然 后 将 65 送 入 计 
算 机 。 类 似 地 ， 当 计算 机 将 ASCII 码 值 65 输出 到 屏幕 上 时 ， 屏 幕 上 会 显示 字母 A。 

TE C++ 中 ， 你 可 用 一 对 单 引 号 括 起 来 的 一 个 字符 来 表示 一 个 字符 常量 。 因 此 ， 常 
量 'A' 代表 大 写字 母 A 的 机 内 编码 。 除 了 标准 字符 ，C++ 还 允许 你 书写 以 反 斜 杠 (\) 开始 
的 由 多 个 字符 表示 的 一 种 特殊 字符 ， 这 种 形式 被 称 为 转 义 序列 (escape sequence)。 表 1-3 列 
出 了 C++ 支持 的 转 义 序列 。 


16.6 字符 串 


当知 干 字符 被 聚集 存储 到 一 个 连续 的 内 存单 元 中 时 通常 是 非常 有 用 的 。 在 编程 中 ， 一 个 
字符 序列 称 为 一 个 字符 串 〈string)。 截 至 目前 ， 你 已 经 在 Helloworld 和 PowersOfTwo 
程序 中 看 到 了 字符 串 都 被 简单 地 用 于 在 屏幕 上 显示 信息 ， 但 是 字符 串 的 应 用 不 仅 限 于 此 。 

在 C++ 中 ， 可 采用 一 对 双 引 号 括 起 来 的 一 串 字 符 来 表示 一 个 字符 串 常量 。 与 字符 类 型 
char 一 样 ，C++ 允许 采用 表 1-3 中 的 转 义 序列 来 表示 字符 串 中 的 特殊 字符 。 如 果 两 个 或 两 
个 以 上 字符 串 连 续 出 现在 程序 中 ， 编 译 器 会 自动 将 它们 连接 在 一 起 。 这 条 规则 的 最 重要 意义 
是 ， 你 可 以 将 一 个 字符 串 分 成 几 行 书写 ， 而 不 至 于 从 左 到 右 写 一 整 行 字符 串 。 

由 于 字符 串 在 很 多 应 用 中 至 关 重 要 ， 因 此 ， 所 有 的 现代 编程 语言 都 包含 了 字符 串 操作 
的 相关 特性 。 遗 憾 的 是 ，C++ 定义 了 两 种 不 同 的 字符 串 类 型 ， 让 问题 复杂 化 了 。 一 种 是 从 C 
语言 继承 下 来 的 旧 的 字符 串 类 型 ， 另 一 种 是 更 复杂 的 支持 面向 对 象 范 型 的 string 类 。 为 
了 减少 混乱 ， 本 书 在 能 使 用 string 的 地 方 都 用 string 类 ， 对 于 大 多 数 人 而 言 ， 可 能 会 
不 经 意 忽略 有 两 种 字符 串 形式 的 存在 。 在 第 3 章 概述 中 ， 这 种 复杂 性 显现 出 丑陋 的 一 面 ， 它 
会 详细 地 涉及 string 类 。 那 一 刻 你 可 以 简单 想象 成 C++ 提供 了 一 个 内 置 的 称 为 string 
的 数据 类 型 ， 其 值 域 为 所 有 字符 序列 的 集合 。 你 可 以 声明 string 类 型 的 变量 ， 并 将 字符 
串 值 作为 形 参 和 返回 结果 在 函数 之 间 进 行 传人 和 传 出 。 


表 1-3 转 义 序列 
\a 警报 ( 嘟 嘟 声 或 响 铃 ) 
\b 退 格 
\f 进 纸 (从 新 一 页 开始 ) 
\n 换行 符 (移动 到 下 一 行 的 起 始 处 ) 
\r 回 车 符 (移动 到 当前 行 的 开始 ， 没 有 前 进 ) 
\t 水 平 制 表 符 (水 平移 动 到 下 一 个 制 表 位 ) 
Ww 垂直 制 表 符 (垂直 移动 到 下 一 个 制 表 位 ) 


V0 空 字符 (字符 的 ASCI 835g 0 ) 


23 
l 
24 
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(2%) 
\\ 字符 \ 本 身 
V 字符 ' (只 用 当 这 个 字符 为 常量 的 时 候 才 用 反 斜 杠 ) 
i 字符 " (只 用 当 这 个 字符 为 常量 的 时 候 才 用 反 斜 杠 ) 
\ddd 任意 字符 


EKE, string 是 一 个 库 类 型 ， 它 的 非 内 置 特性 确实 有 一 些 含意 。 如 果 你 在 程序 中 采 
用 string 类 型 ， 则 需要 在 $include 行 中 增加 string 库 声 明 ， 如 下 所 示 : 

#include <string> 
Fb, HF string 类 型 是 标准 库 命名 空间 的 一 部 分 ， 正 如 在 本 书 中 恒定 不 变 所 做 的 那样 ， 
仅 当 你 在 程序 源 文 件 的 开头 包括 下 行 语 句 时 ， 编 译 器 才 会 识别 string 类 型 名 : 


using namespace std; 


1.6.7” 枚 举 类 型 

上 一 节 讨 论 的 ASCH 码 使 我 们 明白 : 计算 机 通过 对 每 个 字符 赋 一 个 数值 ， 用 整数 形式 存 
储 字符 数据 。 这 种 通过 整数 元 素 的 值 域 编码 数据 的 策略 实际 上 是 一 个 更 一 般 的 原则 。C++ FE 
许 你 通过 列举 它们 值 域 中 的 元 素来 定义 一 种 新 的 类 型 ， 该 类 型 称 为 枚 举 类 型 (enumerated)。 

定义 一 个 枚 举 类 型 的 语法 为 : 

enum typename { namelist }; 


其 中 , typename 是 新 的 枚 举 类 型 名 , namelist 是 其 值 域 中 以 逗号 相隔 的 常量 列表 。 在 本 书 中 ， 
所 有 类 型 名 以 大 写字 母 开始 ， 枚 举 常 量 名 全 部 大 写 。 例 如 ， 以 下 定义 引入 了 一 个 新 的 枚 举 类 
型 Direction， 它 的 值 是 四 个 方向 : 


enum Direction ( NORTH, EAST, SOUTH, WEST ); 


当 C++ 编译 器 遇 到 该 类 型 定义 时 ， 它 会 按 常量 名 的 顺序 ， 从 0 开始 给 每 个 常量 赋值 。 因 此 ， 
NORTH 被 赋值 为 0，ERAST 被 赋值 为 1，SoOUTH 被 赋值 为 2，WEST 被 赋值 为 3。 
C++ 允许 你 给 每 个 枚 举 类 型 的 常量 显示 地 赋值 。 例 如 ， 以 下 类 型 声明 : 


enum Coin { 


PENNY = 1, 
NICKEL = 5 
DIME = 10 


Ei 


引入 了 一 个 表达 美国 货币 的 枚 举 类 型 ， 其 中 每 一 个 常量 定义 了 相应 硬币 的 货币 价值 。 如 
果 你 给 枚 举 类 型 中 的 一 些 而 非 全 部 常量 提供 了 初 值 ， 那 么 C++ 编译 器 会 自动 地 给 未 赋值 
的 常量 赋 以 一 个 你 所 提供 的 最 后 一 个 常量 值 的 后 继 整 数值 。 因 此 ， 以 下 声明 引入 一 个 一 
年 中 各 月 份 的 类 型 ，JANUARY 赋值 为 1，FEBRURARY 赋值 为 2， 一 直 增 加 到 DECEMBER 
赋值 为 12。 
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enum Month { 
JANUARY = 1, 
FEBRUARY, 
MARCH, 
APRIL, 
MAY, 
JUNE, 
JULY, 
AUGUST, 
SEPTEMBER, 
OCTOBER, 
NOVEMBER, 
DECEMBER 

hi 
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在 上 述 各 节 中 ， 所 描述 的 基本 类 型 构成 了 允许 你 基于 已 存在 的 类 型 创建 新 类 型 的 非常 丰 
富 的 类 型 系统 的 基础 。 此 外 ， 因 为 C++ 是 面向 对 象 和 过 程 的 范式 的 集合 ， 系 统 的 类 型 包括 
所 有 对 象 和 传统 的 结构 。 在 很 大 程度 上 ， 学 会 如 何 定义 和 操纵 这 些 类 型 是 这 本 书 的 主题 。 因 
此 ， 就 不 在 本 章 把 这 些 类 型 完整 地 描述 了 ， 这 是 其 余 章节 的 内 容 。 

在 斯 坦 福 大 学 教授 本 课程 的 这 段 时 间 ， 如 果 你 有 机 会 用 高 级 方式 使 用 面向 对 象 编程 ， 类 
和 对 象 定义 的 细节 会 显示 出 来 ， 你 会 更 有 可 能 掌握 面向 对 象 编程 的 概念 。 

本 书 采 用 的 策略 是 在 第 6 章 之 前 推迟 任何 关于 如 何 建立 自己 对 象 的 讨论 ， 到 那 时 你 会 有 
足够 的 时 间 去 发 现 眼 下 对 象 是 如 何 使 用 的 。 


1.7 RER 
无 论 何 时 你 想 要 程序 完成 其 计算 任务 ， 你 需要 编写 一 个 类 似 于 数学 表达 式 的 表达 式 来 指 
定 所 需 的 操作 。 例 如 ， 你 想 求解 一 个 一 元 二 次 方程 : 
ax *bx*c-0 
由 高 等 数学 可 知 ， 该 方程 通过 以 下 式 子 计算 得 到 两 个 解 : 


_ -bxNb'!- 4ac 
Hu 2a 


第 一 个 解 通过 在 + 符号 的 位 置 上 用 十 获得 ， 第 二 个 解 通过 在 + 符号 的 位 置 上 用 一 获得 。 在 
C++ 中 ， 你 可 以 通过 编写 以 下 表达 式 来 获得 方程 的 第 一 个 解 : 


(-b + sqrt(b * b- 4*a*c)) / (2* a) 


与 上 述 公 式 不 同 的 是 : 在 C++ 表达 式 中 乘 用 “*” 表 示 ， 除 用 “/” 表 示 ， 平 方 根 函 数 用 名 
F sqrt 表示 (函数 来 自 <cmath> Æ, KHER 2 章 进 行 介绍 )， 而 不 是 数学 符号 。 尽 管 如 
此 ， 特 别 是 你 用 任何 现代 高 级 程序 设计 语言 编写 过 程序 之 后 ， 会 发 现 C++ 的 表达 式 形式 捕 
获 了 其 对 应 的 数学 公式 的 意图 是 显而易见 的 。 

在 C++ 中 ， 一 个 表达 式 由 项 和 操作 符 组 成 。 项 (term) 代表 单个 数据 的 值 ， 必 须 是 
常量 、 变 量 , 或 函数 的 调用 ,例如 在 前 面 表 达 式 中 的 变量 a、b、c 和 常数 2、4。 操 作 符 
(operator) 是 一 个 字符 (有 时 候 是 短 的 字符 序列 )， 代 表 计 算 的 操作 。 表 1-4 列 出 了 在 C++ 中 
出 现 的 操作 符 。 这 个 表 包 括 数学 操作 符 如 十 、 一 、 还 有 几 个 属于 其 他 类 型 的 操作 符 ， 会 在 以 
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后 的 章节 中 进行 介绍 。 


1.7.1 优先 级 和 结合 


选择 在 一 个 表 中 列 出 所 有 操作 符 的 目的 是 建立 这 个 操作 符 和 其 他 操作 符 之 间 的 优先 级 
( precedence) 关系 。 这 是 一 个 在 不 使 用 圆 括号 的 情况 下 操作 符 在 运算 中 如 何 结合 的 方法 。 如 
果 两 个 操作 符 因 同一 个 操作 竞争 ， 高 优先 级 的 先 应 用 。 因 此 ， 在 以 下 表达 式 中 : 

(-b + sqrt(b*b-4*a*c)) / (2 * a) 
* 的 优先 级 高 于 -， 乘 法 b*b 和 4*axc 会 先 于 减法 进行 运算 。 然 而 ， 非常 重要 的 一 点 是 : - 操作 
符 出 现 两 种 形式 。 要 求 两 个 操作 数 的 操作 符 称 为 二 元 操作 符 (binary operator)， 要 求 一 个 操作 数 的 
操作 符 称 为 一 元 操作 符 ( unary operator)。 当 减 号 写 在 一 个 单独 操作 数 的 前 面 时 ， 如 -b， 它 代表 
一 元 操作 符 表 示 取 反 。 当 减 号 出 现在 两 个 操作 数 之 间 ， 如 sqrt 中 的 参数 形式 ， 它 代表 二 元 操作 
符 表示 减法 。 一 元 操作 符 和 二 元 操作 符 之 间 的 优先 级 是 不 同 的 ， 在 优先 级 表 中 分 别 列 出 了 。 

如 果 两 个 操作 符 有 相同 的 优先 级 ， 它 们 通过 结合 律 ( associativity) 来 判断 是 否 允 许 操 
作 。 结 合 性 表示 操作 符 是 与 左 操 作 数 还 是 右 操 作 数 相 组 合 。 在 C++ 中 ， 大 多 操作 符 是 左 结 
合 的 ( left-associative)， 这 就 意味 着 最 左边 的 操作 符 最 先 求 值 。 少 数 一 些 操作 符 是 右 结合 的 
( right-associative)， 这 就 意味 着 它们 从 右 到 左 组 合 。 本 章 会 在 “赋值 操作 符 ” 一 节 对 它 进行 
讨论 。 每 个 操作 符 的 结合 律 在 表 1-4 中 列 出 。 

一 元 二 次 公式 说 明了 优先 级 和 结合 律 规则 的 重要 性 。 考 虑 一 下 如 果 你 在 表达 式 中 没有 给 
2*a 加 上 一 对 圆 括号 会 发 生 什么 问题 ， 如 下 式 所 示 : 


(-b + sqrt(b* b- 4*a*c)) /2*a DA 


没有 圆 括号 ， 除 (/) 运算 会 先 执行 ， 因 为 操作 符 “/” 的 优先 级 与 操作 符 “* ”的 优先 级 相 
同 ， 它 们 的 结合 律 均 为 左 结合 。 这 个 例子 表明 在 编程 中 使 用 错误 的 操作 符 会 导致 很 严重 的 错 
误 ， 因 此 ， 在 你 的 程序 中 应 避免 此 类 错误 。 





表 1-4 C++ 中 的 操作 符 
以 优先 级 组 整理 的 操作 符 综 


Dp 
BE 
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1.7.2 ”表达 式 中 的 混合 类 型 

在 C++ 中 ， 你 可 以 编写 一 个 包含 各 种 数值 类 型 值 的 表达 式 。 如 果 C++ 遇 到 一 个 具有 不 
同类 型 操作 数 的 操作 符 ， 编 译 器 会 根据 表 1-5 所 示 的 。 表 1.5 数 信 类 型 的 类 型 转换 层次 
规则 自动 选择 某 种 类 型 ， 将 操作 数 转化 为 与 此 相同 的 “long double sin 
类 型 。 计 算 结果 为 转换 后 的 类 型 ， 这 种 类 型 转换 确保 aeg 
了 计算 结果 尽 可 能 地 精确 。 float 


unsigned long 


例如 ， 假 设 n 被 声明 为 一 个 int 类 型 ，x 被 声明 long 


J double 类 型 。 则 表达 式 ne int 
nti unsigned short 
short 
采用 整数 算术 运算 规则 对 表达 式 进 行 求 值 ， 产 生 一 个 char 最 不 精确 
int 类 型 的 结果 。 而 表达 式 ——: 
xl 


通过 将 整 型 1 转换 成 浮 点 值 1.0， 再 采用 双 精 度 的 浮 点 数 算术 规则 进行 相 加 求 值 ， 最 终 得 到 
一 个 double 类 型 的 结果 。 


1.7.3. 整数 除法 和 求 余 操作 符 

事实 上 ， 在 除法 运算 中 比较 有 趣 的 是 : 将 两 个 整数 进行 除法 运算 一 般 来 说 会 得 到 一 个 整 
数 结果 。 如 果 你 编写 一 个 以 下 表达 式 : 

9/4 


因为 表达 式 中 所 有 的 操作 数 都 是 inc 类 型 ，C++ 的 运算 规则 表明 这 个 操作 的 结果 一 定 是 
一 个 整数 。 当 C++ 对 这 个 表达 式 求 值 时 ， 它 用 9 除 以 4， 并 且 委 弃 掉 小 数 部 分 。 因 此 ,在 
C++ 中 ， 这 个 表达 式 的 结果 是 2， 而 不 是 2.25。 

如 果 你 想 精确 地 计算 数学 上 9 除 以 4 的 结果 ,那么 ， 至 少 有 一 个 操作 数 必 须 为 浮 点 数 。 
例如 ， 以 下 三 个 表达 式 : 


9.0/4 
9 / 4.0 
9.0 / 4.0 


每 一 个 计算 结果 都 为 2.25。 仅 当 表达 式 中 的 操作 数 全 部 为 int 类 型 时 ， 小 数 部 分 才 会 被 舍 
Fo BHP BBD NRE BMA BS (truncation). 

C++ 中 的 操作 符 / 与 操作 符 % 紧密 相关 。 操 作 符 % 是 当 第 一 个 操作 数 除 以 第 二 个 操作 
数 时 ， 留 下 余数 作为 结果 。 例 如 ， 表 达 式 


9*4 


的 值 是 1，9 是 4 的 两 倍 ， 余 数 是 1。 下 面 是 操作 符 * 的 一 些 应 用 实例 : 
0 19%4 = 3 

1 20%4 = 0 
0 2001%4 = 1 


% 4 
& 4 
4%4 
操作 符 / 和 ss 在 编程 中 具有 非常 广泛 的 应 用 。 例 如 ， 你 可 以 用 s$ 来 测试 一 个 数 是 否 能 
整除 另 一 个 数 ; 例如 ， 为 了 判断 整数 n 是 否 能 被 3 整除 ， 你 只 需 检验 n%3 的 结果 是 否 为 0 
即 可 。 
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然而 ， 如 果 参 加 / As 操作 的 操作 数 中 有 负数 ,谨慎 使 用 这 两 种 操作 符 是 非常 重要 的 ， 
因为 不 同 的 机 器 可 能 会 产生 不 同 的 结果 。 在 大 多 数 机 器 中 ， 除 法 舍 去 操作 的 结果 为 0, 但 它 
并 未 在 ANSI 标准 中 保证 。 通 常 来 说 ,一 个 好 的 编程 方法 (正如 本 书 示例 中 所 做 的 一 样 ) 在 
有 负 操 作 数 的 情况 下 应 尽量 避免 使 用 这 两 种 操作 符 。 


1.7.4 ”类 型 转换 


在 C++ 中 ， 你 可 以 通过 被 称 之 类 型 转换 (type cast) 的 机 制 将 一 种 类 型 明确 地 转换 成 另 
一 种 类 型 。 在 C++ 中 ， 类 型 转换 常 采用 所 期 望 转换 的 类 型 名 后 跟 一 对 圆 括号 括 起 来 的 欲 转 
换 的 类 型 的 值 的 书写 格式 。 例 如 ， 如 果 num 和 den 被 声明 为 整数 类 型 ， 你 可 以 通过 以 下 表 
达 式 来 获得 浮 点 类 型 的 quotient 值 : 


quotient = double(num) / den; 


上 述 表 达 式 计算 的 第 一 步 是 将 num 转换 为 double 类 型 ， 之 后 ， 像 在 本 章 1.7.2 一 节 所 描述 
的 那样 进行 序 点 算术 运算 。 

只 要 类 型 转换 是 按 表 1-5 所 示 的 类 型 层次 向 上 移 的 ， 这 种 转换 就 不 会 丢失 信息 。 反 之 ， 
若 你 将 一 个 值 从 更 高 精度 的 类 型 转换 到 较 低 精度 的 类 型 ， 则 某 些 信息 就 可 能 会 损失 掉 。 例 
如 ， 如 果 你 将 double 类 型 转换 成 inc 类 型 ， 则 小 数 部 分 就 会 被 简单 地 舍弃 。 因 此 ， 表 
达 式 

int(1.9999) 


的 值 为 整数 1。 


1.7.5 “赋值 操作 符 | 

在 C++ 中 ， 对 变量 的 赋值 是 一 种 内 置 的 表达 式 结 构 。 赋 值 操 作 符 = 需要 两 个 操作 数 ， 
像 + A - 操作 符 一 样 。 赋 值 操 作 符 规 定 其 左 操作 数 的 值 必须 是 可 变 的 ， 通 常 为 一 个 变量 名 。 
当 赋 值 操作 被 执行 时 ， 首 先 计算 赋值 操作 符 右 边 表达 式 的 值 ， 然 后 再 将 该 值 赋值 给 左边 的 变 
量 。 因 此 ， 当 你 计算 以 下 表达 式 时 : 

result = 1 
其 结果 是 将 值 1 赋值 给 变量 result。 在 大 多 数 情况 下 ， 上 述 类 型 的 赋值 表达 式 常 出 现在 简 
单 语句 中 ， 即 采用 表达 式 之 后 加 分 号 的 形式 ， 如 下 行 语 句 所 示 : 

result = 1; 
这 种 语句 称 为 赋值 语句 (assignment statement). 

赋值 操作 符 会 转换 其 右 操 作 数 的 类 型 以 使 它 与 左 操作 数 变 量 的 类 型 相 匹配 。 因 此 ， 如 果 
变量 total 是 double 类 型 的 话 ， 你 所 写 的 以 下 赋值 语句 : 


total = 0; 
TEM 0 被 转换 为 double 类 型 后 再 进行 赋值 。 如 果 被 声明 为 int 类 型 ， 那 么 赋值 语句 
n — 3.14159265; 


的 结果 是 将 3 赋值 给 n， 因 为 右 操 作 数 需 进行 类 型 转化 以 使 它 与 左 操作 数 的 整数 变量 相 
匹配 。 i 
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尽管 赋值 操作 符 经 常 出 现在 简单 语句 中 ， 但 它 也 可 以 被 组 合 进 更 大 的 表达 式 中 = 此 时 ， 
赋值 操作 符 的 功用 就 是 简单 的 赋值 。 例 如 ， 表 达 式 


z= (x = 6) + (y = 7) 


的 作用 是 将 6 赋值 给 x，7 赋值 给 y，13 赋值 给 zs。 在 这 个 例子 中 ， 圆 括号 是 必要 的 ， 因 为 
赋值 操作 符 = 的 优先 级 低 于 操作 符 +。 作 为 较 长 表达 式 的 一 部 分 的 赋值 操作 符 被 称 为 嵌入 式 
赋值 (embedded assignment) . 

SRA SOME GE HZ 18, [HUE ERE ARIETE EE BI, DR TEL ICA TE E RIK 
式 中 很 容易 被 忽视 。 因 此 ， 本 书 除了 在 一 些 赋 值 操作 看 起 来 更 重要 的 特殊 情况 下 ， 一般 限制 
使 用 嵌 人 式 赋 值 。 当 你 想 给 几 个 变量 赋 同 样 的 值 时 ， 赋 值 操作 符 会 变 得 很 重要 ，C++ 将 赋 
值 作为 一 种 操作 符 的 定义 ,使 得 同时 给 多 个 变量 赋 相 同 的 值 变 为 可 能 ， 而 无 须 写 多 个 冉 值 语 
句 ， 仅 需 写 如 下 的 一 条 语句 即 可 : 


nl = n2 = n3 = 0; 


该 语句 的 作用 是 将 n1、n2 和 n3 三 个 变量 全 赋值 为 0。 这 条 语句 之 所 以 能 奏效 ， 是 因为 C++ 
的 赋值 操作 符 是 从 右 向 左 进行 的 。 因 此 ， 上 述 整 个 语句 与 下 面 的 语句 等 价 : 

nl = (n2 = (n3 = 0)); 
首先 ， 计 算 表 达 式 n3=0， 它 将 n3 赋值 为 0， 然 后 ， 将 0 向 左 传递 作为 该 赋值 表达 式 的 值 。 
0 被 赋值 给 n2， 然 后 再 赋值 给 n1。 这 类 语句 被 称 为 多 重 赋 值 (multiple assignment). 

为 了 编程 方便 ，C++ 允许 将 赋值 操作 符 与 二 元 操作 符 相 结合 以 产生 一 种 称 为 缩写 赋值 
(shorthand assignment) 的 形式 。 对 任意 二 元 操作 符 op， 下 述 语 句 


variable op= expression ; 
等 价 于 
variable = variable op (expression) ; 
其 中 ， 括 号 用 于 强调 整个 表达 式 先 于 op 计算 。 因 此 ， 下 述 语 名 
balance += deposit; 
是 下 述 语句 的 缩写 
balance = balance + deposit; 
即 balance 加 上 deposit. 


这 种 缩写 形式 可 用 于 C++ 中 的 任何 二 元 操作 符 ， 你 可 以 用 下 面 这 条 语句 中 的 -= 操作 符 
表达 balance MH surcharge: 


balance -- surcharge; 
类 似 地 ， 你 可 以 用 以 下 语句 表达 x BRE 10: 
x /= 10; 


1.7.6 ” 自 增 和 自 减 操 作 符 


除了 缩写 的 赋值 操作 符 ，C++ 还 提供 了 在 编程 中 尤其 经 常 使 用 的 对 变量 进行 加 1 或 减 
1 操作 的 更 高 级 别 的 缩写 形式 。 对 一 个 变量 加 1 称 为 自 增 (incrementing)， 减 1 称 为 自 减 
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(decrementing)。 为 了 以 一 种 更 简洁 的 形式 来 表示 这 些 操作 ，C++ 采用 符号 ++ 和 -- 来 表示 
自 增 和 自 减 。 例 如 ， 在 C++ 中， 语句 


xtt; 
与 语句 
x += 1; 


有 相同 的 效果 ， 而 这 条 语句 是 以 下 语句 的 简写 : 


x-xti; 

类 似 地 ， 
yo" 

与 语句 
Y -=1; 

有 相同 的 效果 ， 或 写 为 
ye yo oe 


碰巧 自 增 和 自 减 操作 符 比 之 前 例子 中 所 建议 的 操作 更 复杂 。 首 先 ， 自 增 和 自 减 操作 符 都 
可 以 写成 两 种 形式 。 操 作 符 可 以 放 在 操作 数 的 后 面 ， 如 下 所 示 : 


x 
或 者 操作 符 放 在 操作 数 之 前 ， 如 下 所 示 : 


十 十 其 


第 一 种 形式 ， 操 作 符 在 操作 数 之 后 ， 称 为 后 缀 (suffix) 形式 ， 第 二 种 称 为 前 缀 prefix) 
形式 。 

如 果 你 所 做 的 只 是 执行 单独 的 ++ 操作 (正如 你 在 一 条 语句 或 标准 的 for 循环 中 那样 )， 
前 级 和 后 缀 操作 符 具有 完全 相同 的 效果 。 只 有 当 你 在 较 长 的 表达 式 中 使 用 自 增 或 自 减 操作 
符 时 ， 你 才 会 注意 到 前 级 和 后 级 操作 符 的 差别 。 像 所 有 的 操作 符 一 样 ，++ 操作 返回 一 个 值 ， 
但 该 值 与 操作 符 相 对 于 操作 数 的 位 置 有 关 。 有 以 下 两 种 情况 : 

x++ 首先 计算 x 的 值 ， 然 后 再 自 增 x。x 在 自 增 前 将 其 原始 值 返回 给 它 临近 的 表达 式 。 

++x X 首 先 自 增 ， 然 后 把 自 增 后 的 新 值 作为 一 个 整体 使 用 。 
-- 操作 符 除 了 执行 自 减 外 ， 它 和 自 增 操作 符 具 有 类 似 的 行为 

你 也 许 会 奇怪 为 什么 有 人 会 用 这 种 难 懂 的 特性 。++ 和 -- 操作 符 确 实 不 是 必需 的 。 而 
且 ， 并 没有 太 多 地 出 现 这 种 情况 ， 即 在 程序 中 的 复杂 表达 式 中 ， 藤 入 自 增 / 自 减 操作 符 会 比 
采用 它们 的 简单 形式 更 好 。 男 一 方面 ,在 C、C++ A Java 语言 的 历史 传统 中 ，++ 和 -- 是 
根深 蒂 固 的 。 程 序 员 是 如 此 频繁 地 使 用 它们 ， 以 致 这些 操 作 已 成 为 这 些 编程 语言 的 惯用 语 
法 。 鉴 于 它们 在 程序 中 的 广泛 使 用 ， 你 必须 理解 这 些 操 作 以 便于 你 能 理解 现 有 的 程序 代码 。 


1.7.7 布尔 运算 


C++ 定义 了 三 种 类 别 的 操作 符 以 操作 布尔 型 数据 : 关系 操作 符 、 逻 辑 操 作 符 和 ? : 操作 
符 。 关 系 操作 符 (relational operator) 用 于 比较 两 个 值 。C++ 定义 了 以 下 六 种 关系 操作 符 : 
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一 等 于 « 小 于 

!= 不 等 于 >= 大 于 或 等 于 

> 大 于 <= 小 于 或 等 于 

在 程序 中 检查 两 个 值 是 否 相 等 时 ， 注 意 使 用 “==” 操 作 符 ， 它 是 由 两 个 等 号 构成 的 。 


单个 等 号 是 赋值 操作 符 。 由 于 使 用 双 等 号 违背 了 传统 的 数学 符号 用 法 ， 因 此 ， 用 一 个 等 号 代 
蔡 双 等 号 是 特别 常见 的 错误 。 这 种 错误 也 可 能 是 难以 追踪 的 ， 因 为 编译 器 并 不 是 每 次 都 能 检 
查 出 这 样 的 错误 。 单 个 等 号 通常 将 表达 式 转换 为 内 和 藤 赋值 ， 这 在 C++ 语言 中 是 合法 的 ， 即 
使 它 并 不 是 你 所 希望 的 。 

关系 操作 符 可 用 于 比较 基本 类 型 的 数值 ， 例 如 整 型 数值 、 浮 点 型 数值 、 布 尔 值 和 字符 ， 
但 这 些 操作 符 也 可 用 于 类 库 中 的 许多 类 型 ， 例 如 string 类 型 。 

除了 关系 操作 符 ，C++ 语言 定义 了 三 种 逻辑 操作 符 (logical operator)， 它 们 采用 布尔 类 
型 的 操作 数 ， 并 通过 组 合 形成 新 的 布尔 值 : 

! 逻辑 非 (如果 操 作 数 是 false， 结 果 为 true)。 

&& 逻辑 与 (如 果 两 个 操作 数 均 为 true， 结 果 为 true)。 

| 逻辑 或 (如 果 两 个 操作 数 全 部 或 其 中 一 个 为 true， 结 果 为 true)。 
上 述 操 作 符 的 优先 级 依次 递减 。 

尽管 操作 符 “ &&”、“ 上” 和 “1!” 分 别 与 英语 中 的 and, or 和 not 相对 应 ,但 是 用 英语 
来 理解 逻辑 操作 符 是 不 够 准确 的 。 为 了 避免 这 种 不 准确 ， 以 一 种 更 形式 化 的 、 数 学 的 方式 来 
理解 这 些 操 作 符 会 大 有 帮助 。 逻 辑 学 家 用 真 值 表 (truth table) 定义 了 这 些 操作 符 ， 真 值 表 说 
明了 当 操 作 数 的 值 发 生变 化 时 ， 布 尔 表达 式 的 值 是 如 何 变化 的 。 真 值 表 表 1-6 显示 了 每 种 逻 
辑 运算 的 结果 ， 并 给 出 了 变量 p 和 q 的 所 有 可 能 取 值 。 

任何 C++ 程序 以 下 述 形 式 来 计算 一 个 表达 式 


exp, && exp; 
或 者 

exp; || expo? 

上 述 子 表达 式 总 是 自 左 向 右 计算 的 ， 且 一 旦 整个 表达 式 的 值 可 确定 ， 就 立刻 结束 计算 。 
例如 ， 如 果 exp, 在 包含 “&&” 的 表达 式 中 为 false， 那 么 不 需要 计算 expo 的 值 就 可 以 确 
定 整 个 表达 式 的 值 为 falses XWH, ERA “I ”的 表达 式 中 ， 如 果 第 一 个 表达 式 的 值 为 
true， 那 么 就 不 需要 再 计算 第 二 个 表达 式 了 。 这 种 在 可 以 得 到 结果 时 就 立刻 结束 的 计算 方 
式 ， 称 为 短路 求 值 (short-circuit evaluation) 。 


表 1-6 ”逻辑 运算 真 值 表 





C++ 语言 还 提供 了 在 某 些 情况 下 十 分 有 用 的 另外 一 种 布尔 操作 符 : 2: 操作 符 。 在 编程 
领域 , 虽然 问号 、 冒 号 在 代码 中 并 不 是 紧 挨 着 出 现 的 ， 但 它 还 是 被 称 为 “问号 冒号 ”操作 符 。 
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与 C++ 语言 中 的 其 他 操作 符 不 同 ，? : 操作 符 分 两 部 分 书写 ， 需 要 三 个 操作 数 。 其 一 般 形式 
如 下 : 

(condition) ? exp, : expo? 
其 中 总 圆 括 号 并 不 是 必需 的 ， 但 是 C++ 程序 员 通 常 在 程序 中 使 用 它 来 强调 条 件 的 边界 。 

当 C++ 程序 遇 到 2: 操作 符 时 ， 它 首先 计算 条 件 表达 式 ， 如 果 条 件 为 true， 则 将 exp 
的 值 作为 整个 表达 式 的 值 ， 如 果 条 件 为 false， 则 将 exp. 的 值 作为 整个 表达 式 的 值 。 例 如 ， 
可 以 像 下 述 语句 那样 ， 使 用 2: 操作 符 将 x 和 y 中 较 大 的 值 赋值 给 max: 


max = (x > y) ? XxX : y; 


1.8 语句 


C- 十 程序 由 函数 构成 ， 函 数 由 一 系列 语句 组 成 。 正 如 大 多 数 编程 语言 ，C++ 将 语句 划分 为 
两 种 主要 的 类 别 : 简单 语句 (sample statement) 执行 某 些 动作 ， 而 控制 语句 〈 control statement) 
控制 程序 的 流程 。 本 节 回 顾 C++ 现 有 的 主要 语句 形式 ， 它 们 为 你 编写 程序 提供 了 工具 。 


1.8.1 简单 语句 
在 C++ 中， 常用 的 语句 是 简单 语句 ， 简 单 语句 由 表达 式 加 分 号 组 成 : 


expression ; 
在 大 多 数 情况 下 ， 表 达 式 是 一 个 函数 调用 、 赋 值 ， 或 者 是 变量 的 自 增 或 自 减 操作 。 
1.8.2 1k 


正如 在 C++ 中 定义 的 ， 控 制 语句 典型 地 应 用 在 一 条 单一 的 语句 中 。 当 你 编写 程序 时 ， 
你 经 常 想 用 一 条 特定 的 控制 语句 去 控制 一 组 语句 。 为 了 指明 这 一 组 语句 序列 是 一 个 连贯 单元 
的 一 部 分 ， 我 们 用 一 对 花 括号 将 这 些 语 句 聚 集成 一 个 块 (block)， 如 下 所 示 : 

t 


statement, 
statement 


statement, 


} ; 

当 C++ 编译 器 遇见 块 ， 它 会 把 整个 块 当做 一 条 语句 对 待 。 因 此 ， 无 论 何 时 块 中 的 助 记 
符 statement 以 一 种 控制 形式 模式 出 现时 ， 你 都 可 用 一 条 简单 语句 或 者 一 个 块 来 代替 它 。 
就 C++ 编译 器 而 言 ， 为 了 阐明 块 是 由 若干 语句 构成 ， 块 有 时 被 称 为 复合 语句 (compound 
statement)。 在 C++ 中， 任何 块 中 的 语句 可 以 冠 以 变量 的 声明 。 

一 个 块 内 的 语句 常常 在 块 内 进行 缩 进 。 编 译 器 忽略 缩 进 ， 但 是 缩 进 的 视觉 效果 会 使 代码 
易于 阅读 ， 因 为 它 使 程序 的 结构 更 清晰 。 经 验 表 明 每 行 缩 进 三 个 或 四 个 空格 有 助 于 理解 程序 
的 结构 ; 本 书 中 的 程序 均 采用 缩 进 三 个 空格 的 形式 。 缩 进 是 良好 编程 的 关键 ， 因 此 ， 你 应 该 
努力 地 开发 具有 一 致 缩 进 风格 的 程序 。 


1.8.3 if Z4 
编写 程序 时 ， 你 经 常会 检测 一 些 条 件 是 否 满足 ， 并 采用 这 些 检 测 结果 来 控制 程序 的 后 续 
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执行 。 这 种 类 型 的 程序 控制 称 为 条 件 执行 ( conditional execution), TE C++ 中 ， 表 达 条 件 执 
行 最 简单 的 方法 就 是 使 用 if 语句 ， 它 有 以 下 两 种 形式 ; 


if (condition) statement 


if (condition) statement else statement 


当 你 的 解决 策略 只 是 在 特定 的 布尔 条 件 为 真 时 调用 一 个 语句 的 执行 ， 你 可 以 使 用 第 一 种 形 
式 。 如 果 条 件 为 假 时 ， 则 跳 过 if 语句 或 语句 块 。 当 你 用 第 二 种 形式 时 ， 程 序 必 须根 据 测 试 
条 件 在 两 个 独立 的 成 套 语句 中 选择 其 中 一 个 。 这 种 语句 形式 我 们 采用 以 下 的 程序 进行 说 明 ， 
此 程序 显示 了 n 是 奇数 还 是 偶数 : 
if (n$ 2 == 0) ( 
cout «« "That number is even." «« endl; 


) eise ( 
cout «« "That number is odd." «« endl; 


} 


与 任何 控制 语句 一 样 ，if 语句 中 的 控制 语句 可 以 是 一 条 简单 语句 ， 或 者 是 一 个 语句 块 。 
即使 控制 体 是 一 条 简单 语句 ， 为 了 提高 程序 的 可 读 性 ， 你 需 加 上 一 对 花 括 号 。 本 书 程序 中 的 
每 一 条 控制 语句 体 而 非 整 个 语句 (控制 形式 和 控制 体 ) 都 被 包含 在 一 个 块 内 ， 它 是 如 此 之 短 
以 至 于 它 仅 占 一 行 。 


1.8.44 switch 语句 


对 于 那些 有 两 种 决策 点 : 某 些 条 件 要 么 是 true 要 么 是 false， 并 且 程 序 依据 此 条 件 
执行 其 逻辑 调用 的 应 用 ，it 语句 是 理想 的 选择 。 然 而 ， 某 些 应 用 要 求 更 复杂 的 涉及 若干 互 
斥 执行 条 件 的 决策 结构 ， 例 如 : 一 种 情况 ， 程 序 应 该 执行 x;， 另外 一 种 情况 ， 应 该 执行 y ; 
第 三 种 情况 ， 需 要 执行 z， 等 等 。 许 多 应 用 在 这 种 情况 下 最 合适 使 用 switch 语句 ， 它 遵循 
以 下 语法 格式 : 

switch (e) { 

a 

break; 
E 

break; 

. more case clauses . . . 
default: 

statements 


break; 


} 


KIKA e 称 为 控制 表达 式 (control expression ) 。 当 程序 执行 switch 语句 时 ， 它 计算 控 
制 表达 式 并 将 计算 值 与 cl 、c2 等 的 值 进行 比较 ， 每 一 个 值 必须 是 常量 。 如 果 cl. c2 等 任意 
一 个 常量 和 控制 表达 式 的 值 相 匹配 ， 则 语句 跳 转 至 该 case 子 句 执行 。 当 程序 执行 到 case 
子 句 最 后 的 break 语句 时 ， 则 表明 该 case 子 句 执行 结束 跳出 该 case 子 句 ， 接 着 执行 整 
个 switch 语句 后 面 的 语句 。 

default 子 名 用 来 执行 那些 没有 和 控制 表达 式 相 匹配 值 的 操作 。default 子 句 是 可 选 
的 。 如 果 没 有 匹配 的 case 子 句 ， 也 就 没有 default 子 句 ， 程 序 不 做 任何 处 理 ， 继 续 执行 
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switch 语句 后 面 的 语句 。 为 了 防止 程序 忽略 一 些 意 想 不 到 的 情况 ， 除 非 你 确定 列举 了 所 有 
的 可 能 情况 ， 和 否则 在 每 个 switch 语句 增加 default 语句 是 一 个 好 的 编程 习惯 。 

我 所 用 过 的 说 明 switch 语句 语法 的 代码 模式 都 强力 推荐 在 每 个 子 句 的 后 面 添加 
break 语句 。 事 实 上 ，C++ 定义 了 当 没 有 break 语句 时 ， 程 序 在 执行 完 所 选择 的 case if 
名 后 ， 会 继续 执行 其 后 面 的 语句 。 当 这 种 设计 在 某 些 情况 下 有 用 时 ， 它 会 带 来 很 多 问题 而 不 
是 解决 方案 。 为 了 牢记 在 每 个 case 子 句 后 跳出 的 重要 性 ， 本 书 程 序 中 的 每 个 case 子 句 后 
面 都 有 break 或 return 语句 。 

这 个 原则 有 一 个 例外 ， 即 多 条 case 语句 表示 多 个 不 同 的 常量 时 可 接连 出 现 。 例 如 ， 
switch 语句 可 能 包含 以 下 的 代码 : 


case 1: 

case 2: 
statements 
break; 


这 表明 : WR select 表达 式 的 值 是 1 或 者 2， 特 定 的 语句 将 被 执行 。C++ 编译 器 把 上 述 结 
构 当 做 两 个 case 语句 ， 其 中 第 一 个 是 空 的 。 因 为 这 个 空 语 句 没 有 break 语句 ， 则 程序 选 
择 第 一 个 case 子 语 之 后 继续 向 下 执行 第 二 个 case 子 句 。 然 而 ， 从 这 个 概念 角度 上 讲 ， 如 
果 你 把 这 个 结构 看 做 是 代表 两 种 可 能 性 的 一 条 case 子 句 ， 那 样 可 能 更 好 。 
在 switch 语句 中 的 常数 必须 是 标量 类 型 (scalar type) , 在 C++ 中， 它 定 义 成 是 一 种 其 
底层 采用 整数 表示 的 类 型 。 特 别 是 字符 经 常用 作 case 常量 ， 正 如 以 下 所 示 的 测试 参数 是 否 
是 元 音 的 函数 : 


bool isVowel(char ch) { 
switch (ch) { 
case 'A': case 'E': case 'I': case 'O': case 'U': 
case 'a': case 'e': case 'i': case 'o': case 'u': 
return true; 
default: 
return false; 
) 
) 


枚 举 类 型 也 可 以 用 作 标 量 类 型 ， 如 以 下 函数 所 示 : 


string directionToString(Direction dir) ( 
switch (dir) ( 
case NORTH: return "NORTH"; 
case EAST: return "EAST"; 
case SOUTH: return "SOUTH"; 
case WEST: return "WEST"; 
default: return "???"; 
) 
} 


该 函数 将 一 个 Direction 类 型 的 值 转换 为 string 2878, WR air 的 值 没有 匹配 到 任何 
一 个 Direction 常量 ,， 则 defalt 子 句 返 回 "272", 

作为 使 用 枚 举 类 型 的 switch 语句 的 第 二 个 例子 ， 以 下 函数 返回 一 个 特定 年 月 的 总 的 
天 数 : 
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int daysInMonth (Month month, int year) ( 
switch (month) ( 
case APRIL: 
case JUNE: 
case SEPTEMBER: 
case NOVEMBER: 
return 30; 
case FEBRUARY: 
return (isLeapYear(year)) ? 29 : 28; 
default: 
return 31; 
) 
} 


上 述 代 码 认 为 测试 year 是 否 为 头 年 的 函数 isLeapYear(year) 已 经 存在 。 你 可 以 使 用 
|| 和 &g 操作 符 来 实现 isLeapYear, MF Atm: 

bool isLeapYear(int year) ( 

return ((year % 4 == 0) && (year % 100 != 0)) 
|| (year % 400 == 0); 

} 
该 函数 编写 了 如 何 判断 半 年 : —-S FE EE — TREE 4 整除 ， 但 不 能 被 100 整除 ， 或 者 能 
被 400 整除 的 年 份 。 

返回 布尔 类 型 值 的 函数 (如 本 节 中 的 isVowel 和 isLeapYeaz MM) 均 称 为 判定 函 
数 ( predicate function)。 判 定 函 数 在 程序 设计 中 扮演 着 重要 的 角色 ， 你 会 在 本 书 中 多 次 遇 到 
它们 。 





1.8.5 while 语句 


除了 条 件 语句 if 和 switch ZH}, C++ 还 包含 其 他 几 种 控制 语句 ， 它 允许 以 循环 的 方 
式 多 次 执行 程序 中 的 一 部 分 。 这 样 的 控制 语句 称 为 迭代 语句 ( interative statement)。 在 C++ 
中 ， 最 简单 的 迭代 语句 是 while 语句 ， 它 可 以 循环 地 执行 语句 直至 条 件 表达 式 为 falses 
一 般 形 式 的 while 语句 如 下 所 示 : 


while (conditional-expression) { 
statements 


) 

当 程 序 遇 到 while 语句 时 ， 首 先 查看 条 件 表达 式 的 值 是 true 还 是 false。 若 条 件 表 
达 式 的 值 为 false， 则 循环 终止 (terminate)， 程 序 接着 执行 整个 while 语句 后 面 的 语句 。 
当 条 件 表达 式 值 为 true 时 ， 整 个 循环 体 被 执行 ， 然 后 程序 返回 到 循环 的 开始 再 一 次 检查 条 
件 表 达 式 的 值 。 通 过 一 次 循环 体 语 句 构 成 了 循环 的 一 个 周期 (cycle)。 

while 循环 有 两 条 重要 的 原则 : 

1. 在 每 个 循环 周期 ， 包 括 第 一 次 循环 ， 条 件 表 达 式 都 会 被 测试 。 如 果 一 开始 测试 结果 为 
false， 则 整个 循环 体 一 次 也 不 会 被 执行 。 

2. 条 件 测试 仅 在 循环 开始 的 每 个 周期 前 进行 。 若 在 循环 的 某 一 时 刻 条 件 变 为 false, 
程序 不 会 注意 到 此 情况 直至 完成 全 部 的 这 个 循环 周期 。 之 后 ， 程 序 将 再 次 测试 条 件 。 如 果 结 
果 为 false， 则 循环 结束 。 

以 下 函数 展示 了 while 循环 操作 ， 该 函数 计算 一 个 整数 的 每 位 数字 之 和 : 
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int digitSum(int n) { 
int sum = 0; 
while (n > 0) { 
sum += n $ 10; 
n /= 10; 
} 
return sum; 


} 


该 函数 依赖 下 述 观察 : 

e 表达 式 n $ 10 返回 正 整数 n 的 最 后 一 位 数 。 

e 表达 式 n / 10 返回 整除 运算 后 舍 去 n 最 后 一 位 数 的 一 个 整数 。 

while 循环 被 设计 成 适合 于 重复 操作 执行 前 需 首 先进 行 某 些 条 件 测试 的 情况 。 若 你 试 
图 解决 的 问题 适合 于 这 种 结构 ， 那 么 while 循环 是 一 种 理想 的 工具 。 很 遗憾 ， 很 多 程序 设 
计 问 题 并 不 简单 地 适合 于 标准 的 while 循环 结构 。 某 些 问题 并 不 是 在 操作 的 开始 允许 进行 
某 种 方便 的 测试 ， 而 大 多 数 是 要 求 你 在 循环 的 中 间 来 编写 判断 循环 是 否 能 够 结束 的 测试 条 件 
代码 。 

这 种 循环 结构 最 常见 的 例子 就 是 从 用 户 那 里 读 取 数据 ， 直 到 遇 到 某 个 表示 输入 结 
的 特定 数值 ， 即 信号 量 (sentinel) 。 当 用 英语 表达 时 ， 基 于 信号 量 的 循环 包括 以 下 重复 的 
步骤 : 

1. 读 和 人 一 个 值 。 

2. 当 读 入 值 与 信号 量 相 等 ， 退 出 循环 。 

3. 否则 ， 执 行 该 值 所 需 的 处 理 。 

遗憾 的 是 ， 在 循环 开始 时 ， 没 有 可 执行 的 测试 以 确定 循环 的 结束 。 循 环 的 终止 条 件 是 输 
入 值 与 信号 量 的 值 相等 。 为 了 检查 这 一 条 件 ， 程 序 首先 需要 读 取 一 些 数 。 如 果 程 序 还 未 读 入 
一 个 数 ， 终 止 条 件 就 没有 作用 。 

在 测试 终止 条 件 前 必须 执行 某 些 操作 时 ， 程 序 员 碰 到 了 称 之 为 循环 和 一 半 问 题 (loop- 
and-a-half problem) 的 情况 。C++ 提 供 的 解决 该 问题 的 策略 是 使 用 break 语 句 ， 除 
T break 语句 在 switch 语句 中 的 应 用 外 ， 它 同样 可 以 立即 结束 最 内 层 的 循环 。 采用 
break， 可 能 以 下 面 遵 循 问题 的 本 来 结构 的 形式 来 编写 循环 结构 ， 这 种 循环 编程 模式 称 为 读 
直到 信号 量 模式 (read-until-sentinel pattern): 


while (true) ( 
Prompt user and read in a value. 
if (value == sentinel) break; 
Process the data value. 


} 


while (true) 


代码 行 似 乎 引入 了 一 个 无 限 循环 ， 因 为 常量 true 永远 也 不 可 能 变 为 false。 该 程序 跳出 循 
环 的 唯一 方式 是 通过 执行 while 语句 中 的 break 语句 。 图 1-5 所 示 的 AddIntegerList fÉ 
序 采用 读 直到 信号 量 模式 来 计算 一 系列 整数 之 和 ， 程 序 采 用 信号 量 值 0 来 结束 循环 。 

还 有 其 他 一 些 策略 来 解决 循环 和 一 半 问 题 ， 这 些 策略 大 多 数 使 用 复制 一 段 程序 放 在 循环 
体 之 外 ,或 者 引入 额外 的 布尔 变量 。 已 有 的 经 验 表 明 : 在 循环 中 使 用 break 语句 退出 循环 
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相对 于 使 用 其 他 策略 而 言 ， 更 有 可 能 编写 出 正确 的 程序 。 以 上 证 据 和 我 的 经 验 使 我 相信 : 使 
用 读 直 到 信号 量 模式 是 解决 循环 和 一 半 问 题 的 最 佳 解决 方案 。 


1.8.6 for 语句 


在 C++ 中， 最 重要 的 控制 语句 就 是 for 语句 ， 它 适合 你 以 特定 的 循环 次 数 来 重复 执行 
某 个 操作 。 所 有 现代 编程 语言 都 有 一 条 对 应 的 完成 该 功能 的 语句 ， 但 是 在 C 语言 家 族 中 ， 
for 语句 在 各 种 应 用 中 其 功能 特别 强大 和 有 用 。 

在 本 节 之 前 的 PowersofTwo 程序 中 ， 你 已 经 见 到 了 两 个 for 循环 的 实例 。 第 一 个 出 
现在 主 程序 中 ， 它 通过 所 期 望 的 指数 值 来 执行 循环 。 该 循环 看 起 来 如 下 所 示 : 


for (int i = 0; i <= limit; itt) { 
cout << "2 to the " << i << "=" 
«« raiseToPower(2, i) «« endl; 


File: AddIntegerList.cpp 


This program adds a list of integers. The end of the input is 
indicated by entering a sentinel value, which is defined by 
* setting the value of the constant SENTINEL. 


#include <iostream> 
using namespace std; 


/* 


* Constant: SENTINEL 
* 


* Defines the value used to terminate the input list. This value must 
* be chosen so that it is not one that could naturally appear in the 

* input data. In the AddIntegerList application, the value 0 is an 

* appropriate sentinel because the user can simply skip any 0 values 
* 
* 


in the input. 


/ 
const int SENTINEL - 0; 
/* Main program */ 


int main() ( 
cout «« "This program adds a list of numbers." «« endl; 
cout << "Use " << SENTINEL << " to signal the end." << endl; 
int total = 0; 
while (true) ( 
int value; 
cout << " ? "; 
cin »» value; 
if (value -- SENTINEL) break; 
total += value; 
) 
cout «« "The total is " «« total «« endl; 
return 0; 





图 1-5 一 系列 整数 之 和 的 程序 
第 二 个 循环 实例 出 现在 函数 raiseToPower 的 实现 中 ， 具 有 以 下 形式 : 


for (int i = 0; i € k; it*) £ 
result *- n; 


) 
上 述 两 个 循环 实例 都 展现 了 当 你 编写 程序 时 会 经 常 采用 的 惯用 模式 。 


30 IŽ 


在 上 述 两 个 模式 中 ， 第 二 个 更 常见 。 该 模式 的 一 般 形式 如 下 : 


for (int var = 0; var < n; Var++) 


该 循环 的 功能 是 执行 循环 体 n 次 。 你 可 以 在 这 个 模式 中 替换 任意 一 个 变量 名 ， 但 那个 变量 通 
WHE for 循环 体内 根本 不 用 ， 正 如 它 在 函数 raiseToPower 中 的 情况 一 样 。 
在 主 程序 中 ， 数 据 计 数 模式 通常 采用 以 下 的 一 般 循环 形式 : 


for (int var = start; var <= finish; vart++) 


在 该 模式 中 ，for 循环 体 通过 对 循环 变量 var 设置 为 start 和 finish 之 间 的 (包括 
finish) 每 一 个 值 ， 其 循环 体 被 多 次 执行 。 因 此 ， 你 可 以 采用 取 值 为 从 1 到 100 的 循环 变 
量 i 来 表示 如 下 的 for 循环 语句 : 


for (int i = 1; i <= 100; i++) 


你 也 可 以 使 用 for 循环 完成 阶乘 功能 ， 它 定义 为 1 到 n 之 间 的 所 有 整数 的 乘积 ， 通 常用 数 
学 式 n 1! 表示 。 类 似 于 函数 raiseToPower， 其 实现 代码 如 下 所 示 : 


int fact(int n) ( 
int result - 1; 
for (int i = 1; i <= n; itt) { 
result *= i; 
) 


return result; 


) 

在 上 述 实 现 中 ，for 循环 确保 循环 变量 i 从 1 计数 到 mn。 循环 体 通 过 给 result FV iX 
更 新 result 值 ， 从 而 依次 得 到 它 所 期 望 的 值 。 

在 for 循环 中 ， 使 用 的 变量 称 为 循环 变量 (index variable)。 常 用 单个 字符 的 变量 名 ， 
例如 守 和 j， 它 们 作为 循环 变量 至 少 可 以 追溯 到 FORTRAN 语言 的 早期 版 本 ， 该 语言 要 求 
循环 变量 为 整 型 变量 ， 且 其 变量 名 应 为 从 字母 表 中 已 预定 义 的 字母 开头 。 尽 管 简短 的 变量 名 
通常 很 少 选 用 ， 因 为 它们 传达 了 太 少 的 关于 该 变量 的 目的 信息 ， 但 事实 上 ， 这 种 循环 变量 简 
短 的 命名 公约 使 得 它 在 这 种 for 语 境 中 很 合适 。 当 你 看 到 for 语句 中 的 循环 变量 i 、j 时 ， 
你 会 很 自然 地 确信 这 个 变量 是 在 某 个 值 域内 计数 的 。 

不 过 ，C++ 的 for 循环 比 之 前 所 提 到 的 实例 更 通用 。for 循环 的 一 般 模式 如 下 : 


for (init; test; step) ( 
statements 


) 
上 述 代码 和 下 面 的 while 语句 等 价 : 
init; 
while (fest) { 
statements 
step; 
) 
该 代码 段 以 init 开始 ， 这 典型 的 是 一 个 变量 声明 ， 并 在 循环 开始 之 前 用 于 对 循环 变量 的 初 
始 化 。 例 如 ， 若 你 写 了 以 下 语句 : 


for (ink íi -07;. .. 


则 循环 以 循环 变量 i 被 设置 为 0 开始 。 如 果 循 环 以 下 述 形式 开始 : 
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for (int i = -7; 


则 变量 i 从 -7 开始 ， 以 此 类 推 。 

test 表达 式 是 条 件 测试 ， 正 如 while 语句 中 的 测试 一 样 。 当 测试 表达 式 为 true， 循 环 
继续 。 因 此 ， 以 下 循环 : 

for (int i = 0; i < n; i++) 


i 从 0 开始 直至 小 于 n， 即 以 0、1、2 等 ， 直 到 最 后 一 个 值 n-1， 总 共 执行 n 次 循环 。 在 以 
下 这 个 循环 中 : 

for (inti = 1; i <= n; i++) 
i 从 1 开始 直至 小 于 等 于 n， 即 以 1、2 等 ， 直 到 n, AHIT n 次 循环 。 

step 表达 式 表 明 循环 变量 从 一 次 循环 到 下 一 次 循环 的 递增 值 。 常 用 的 step 规范 形式 是 使 
用 ++ 操作 符 来 使 循环 变量 自 增 ， 但 这 并 不 是 唯一 的 形式 。 例 如 ， 也 可 采用 反 向 计数 的 -- 
操作 符 ， 或 不 用 ++ 操作 符 采用 += 2 表示 循环 变量 每 次 自 增 2。 

以 下 程序 展示 了 一 个 反 向 计数 的 实例 : 

int main() ( 


for (int t = 10; t »- 0; t--) ( 
cout «« t «« endl; 





for 语句 括号 内 的 每 个 表达 式 都 是 可 选 的 ， 但 是 分 号 不 可 少 。 如 果 没 有 init 部 分 ， 就 无 
初始 化 的 执行 。 如 果 没 有 test 部 分 ，C++ 就 默认 为 true。 如 果 没 有 step 部 分 ， 在 整个 循环 
周期 内 循环 变量 就 不 会 改变 。 


本 章 小 结 

本 章 是 对 C++ 的 概述 ， 很 难 精简 它 为 几 个 要 点 。 目 的 是 为 了 给 你 概要 性 地 介绍 C++ 编 
程 语言 ， 快 速 地 培养 你 使 用 这 个 语言 编写 一 些 简单 的 程序 。 本 章 集中 在 语言 的 底层 结构 、 表 
达 式 和 语句 的 概念 上 ， 将 它们 集合 起 来 就 可 以 定义 函数 。 

本 章 的 要 点 包括 : 

e 在 C++ 编程 语言 存在 的 30 多 年 里 ， 它 已 经 成 为 世界 上 最 广泛 使 用 的 编程 语言 。 

e 典型 的 C++ 程序 由 注释 、 包 含 的 库 文件 、 程 序 级 定义 、 函 数 原 型 、 当 程序 启动 时 所 
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调用 名 为 main 的 函数 ， 以 及 与 main 函数 共同 完成 程序 功能 的 一 组 辅助 函数 构成 。 
C++ 中 的 变量 在 使 用 前 必须 声明 。C++ 中 大 部 分 变量 是 局 部 变量 ,它们 声明 在 函数 
体内 ， 也 仅 能 在 声明 它 的 那个 函数 体内 使 用 。 

一 个 数据 类 型 是 由 其 值 域 和 其 操作 集 定义 的 。C++ 中 内 置 了 几 种 基本 类 型 ， 这 些 类 
型 允许 程序 存储 常见 的 数据 值 ， 包 括 整 数 、 淫 点数、 布尔 值 和 字符 。 正 如 在 后 面 章 
节 中 你 会 学 到 的 ，C++ 允许 程序 员 基 于 已 存在 的 类 型 定义 一 些 新 的 类 型 。 

C++ 完成 输入 输出 操作 最 简单 的 方式 是 使 用 iostream 库 。 这 个 库 定义 了 三 种 涉及 
控制 台 的 标准 流 : cin 从 控制 台 读 取 输 入 数据 ，cout 向 控制 台 编 写 正常 程序 的 输出 ， 
cerr 向 控制 台 报告 错误 信息 。 控 制 台 输 入 习惯 上 用 >> 操作 符 表示 ， 如 以 下 语句 : 
cin >> limit; 

它 从 控制 台 读 取 一 个 值 存储 到 变量 limit 中 。 输 出 控制 台 使 用 << 操作 符 表示 ， 如 
以 下 语句 所 示 : 

cout «« "The answer is " << answer << endl; 


它 在 控制 台 上 显示 answer 的 值 ， 及 它 的 识别 标签 “ The answer is”, endl 确保 了 
下 一 个 控制 台 的 输出 显示 在 新 的 一 行 。 

C++ 中 表达 式 的 书写 形式 和 其 他 大 多 数 的 程序 设计 语言 一 样 ， 由 各 种 操作 符 构 成 。 
C++ 的 操作 符 以 及 它 的 优先 级 和 结合 性 列 示 在 表 1-4 中 。 

C++ 中 的 语句 分 为 两 大 类 : 简单 语句 和 控制 语句 。 一 条 简单 语句 是 一 个 表达 式 CHR 
型 的 是 一 条 赋值 表达 式 或 函数 调用 表达 式 )， 后 面 连 着 分 号 。 本 章 所 讲述 的 控制 语句 
A if, switch, while 和 for 语 句 。 前 两 个 用 于 表示 条 件 执行 ， 后 两 个 用 于 进行 
具体 的 循环 。 

C++ 程序 一 般 由 若干 个 函数 构成 。 你 可 以 使 用 本 章 的 例子 作为 你 编写 自己 函数 的 模 
型 ,或 者 你 可 以 等 到 第 2 章 涵盖 了 更 多 的 函数 细节 后 你 再 编写 自己 的 函数 。 


复习 题 

1. 当 你 编写 一 个 C 程序 时 ， 你 是 准备 一 个 源 文件 还 是 一 个 目标 文件 ? 

2. C++ 程序 中 用 什么 字符 标记 注释 ? 

3. 在 #include 这 一 行 ， 库 的 头 文件 名 可 以 用 尖 括 号 和 双 引 号 包含 。 这 两 种 形式 的 标记 法 有 什么 


不 同 ? 


4. 如 何 定 义 一 个 值 为 2.54， 名 字 为 CENTIMETERS PER_INCH 的 常量 ? 

5. 什么 函数 名 必须 在 每 个 C++ 程序 中 定义 ? 在 函数 的 结束 处 ， 典 型 的 是 哪 种 语句 ? 
6. 当 你 编写 cout HH int, endl 的 目的 是 什么 ? 

7. 定义 以 下 与 变量 有 关 的 术语 : name, type, values 和 scope. 

8. 指出 以 下 哪些 是 合法 的 C++ 变量 名 : 


moa pnoge 


x g. total output 

formulal h. aVeryLongVariableName 
average rainfall i. 12MonthTotal 

&correct j | marginal-cost 

short k. b4hand 

tiny l. stk depth 


9. 数据 类 型 所 定义 的 两 个 属性 是 什么 ? 
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10. short, int Al long 类 型 的 区 别 是 什么 ? 
11. ASCII 代表 什么 ? 
12. 列 出 所 有 boo1 类 型 的 可 能 取 值 。 
13. 从 用 户 处 读 取 数 据 并 将 其 读 人 到 double 类 型 的 变量 x 中 ,这 段 程序 需要 包含 哪些 语句 ? 
14. 假设 一 个 函数 包含 以 下 声明 : 
esa A 
char c; 
string s; 
编写 一 条 在 屏幕 上 显示 上 述 每 个 变量 名 和 其 值 的 语句 ， 以 便 你 可 以 区 分 这 些 变量 。 
15. 指出 以 下 表达 式 的 值 和 类 型 : 


a. 2+3 d. 3 * 6.0 
b. 19 7 '5 e. -19 $ 5 
c 19.0 /.5 £ 29717 
16. 一 元 减 和 减法 操作 符 的 区 别 是 什么 ? 
17. REAA (truncation) 是 什么 意思 ? 


18. 什么 是 类 型 转换 ? 在 C++ 中 如 何 表 示 它 ? 
19. 计算 下 列表 达 式 的 结果 : 
a 64*5/42-3 
b 2+2* (2* 2-2) %2/2 
c 10+9* ((8+7) $6 +5*4%3* 241 
d. 1+2+ (344) * ((5 * 6% 7 * 8) - 9) - 10 
20. 你 如 何 指定 一 个 缩写 的 赋值 操作 ? 
21. 表达 式 ++x 和 x++ 的 区 别 是 什么 ? 
22. 短路 求 值 是 什么 意思 ? 
23. 写 出 下 列 控制 语句 的 一 般 语法 形式 : 
if, switch, while 和 for。 
24. 用 英语 描述 switch 语句 操作 ， 包 括 在 每 个 case 语句 后 面 使 用 的 break 语句 。 
25. 什么 是 信号 量 ? 
26. 在 下 述 情况 中 ， 你 会 用 哪个 for 循环 的 控制 段 ? 
a. 计数 从 1 到 100。 
b. 计数 从 0 开始 ， 间 隔 为 7， 直 到 数字 超过 两 位 数 。 
c. 计数 从 100 到 0 的 间隔 为 2 的 倒序 。 


习题 
1. 编写 一 个 程序 ， 它 读 取 摄氏 温度 (C)， 显 示 对 应 的 华氏 温度 (F)， 摄 氏 温度 与 华氏 温度 的 换算 公 
式 是 : 


— 


_ 9 
F= $C*2 
2. 编写 一 个 程序 ， 它 将 以 米 为 单位 的 长 度 换算 成 相应 的 以 英寸 和 英尺 为 单位 的 长 度 。 你 需要 的 换算 关 
系 为 : 
1 英寸 三 0.0254 Æ% 
1 英尺 王位 黄征 


3. 在 数学 史 有 这 样 一 个 故事 ,德国 数学 家 卡尔 . 弗 里 德里 希 ' 高 斯 (1777 一 1855 ) 在 很 小 的 时 候 就 很 
有 数学 天 赋 。 当 高 斯 还 在 小 学 的 时 候 ， 老 师 就 让 他 计算 从 1 到 100 的 数字 之 和 。 他 很 快 给 出 了 答案 : 
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5050。 编 写 一 个 程序 ， 计 算 高 斯 的 老师 所 提出 的 问题 。 

4. 编写 一 个 程序 ， 它 读 取 正 整 数 N， 计 算 前 N 个 奇数 之 和 。 例 如 , N 是 4， 你 的 程序 结果 是 计算 1 十 
3 十 5 十 7， 结 果 为 16。 

5. 编写 一 个 程序 ， 从 用 户 处 读 取 数据 直到 用 户 输入 了 0 信号 量 为 止 。 当 信号 量 出 现时 ， 程 序 需要 显示 
读 取 数 据 的 最 大 值 ， 如 以 下 运行 结果 : 





确保 你 的 信号 量 是 个 常量 而 且 易 于 改变 。 并 且 确 保 你 的 程序 当 输 入 数据 均 为 负数 时 也 能 正确 运行 。 
6. 做 一 些 轻微 有 趣 的 挑战 ， 编 写 一 个 程序 ， 在 输入 信号 量 后 找 出 输入 数据 中 最 大 和 次 大 的 数值 。 如 果 
继续 使 用 0 作为 信号 量 ， inimi 果 如 下 所 示 : 


argest integer in a list. 
Enter 0 to signal the end of the list. 


The largest value was 766. 
The second largest value was 636. 





这 个 例子 使 用 的 数据 是 乔 安娜 .凯瑟琳 ” 罗 琳 《 哈 利 * 波 特 》 系 列 英国 精装 版 的 页 数 。 输 出 告诉 我 
们 最 长 的 书 《 哈 利 ' 波 特 与 凤凰 令 》 有 766 页 ， 次 长 的 书 《 哈 利 . 波 特 与 火焰 杯 》 有 636 XL. 

7. 以 图 1-5 中 的 AddIntegerList 程序 为 模板 ， 编 写 程序 AverageList， 它 读 取 成 绩 分 数 ， 并 显 
示 平 均值 。 因 为 某 些 预 备 生 的 成 绩 可 能 实际 为 0， 你 的 程序 应 该 使 用 -1 作为 输入 结束 的 信号 量 。 

8. 使 用 “ while 语句 ” 那 节 的 digitsum 函数 作为 模板 ， 编 写 一 个 程序 ， 读 取 一 个 整数 ， 然 后 逆序 
输出 该 整数 中 的 各 位 数 ， 如 以 下 示例 运行 结果 : 





EATI TERT D AUR UL OR 这 类 因 式 分 解 是 唯一 的 ， 被 称 为 质 因 数 分 解 
is factorization)。 例 如 ， 数 字 60 可 以 被 分 解 成 2X2X3X5， 每 个 因数 都 是 素数 。 注 意 : 在 因 式 
分 解 中 ， 同 样 的 素数 可 以 出 现 多 次 。 
编写 一 个 程序 ， 对 数字 n 进行 质 因数 分 解 ， 如 以 下 示例 运行 结果 : 
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10. 1979 年 ， 印 第 安 纳 大 学 认 知 科学 教授 道格拉斯 ， 霍 夫 斯 塔 勒 (Douglas Hofstadter), *j f (EHEZ, 


一 
一 


N 


艾 舍 尔 、 巴 赫 》 一 书 ， 这 本 书 他 形容 为 “本 着 刘易斯 * 卡 罗 尔 精神 ， 在 心灵 与 机 器 隐喻 中 的 一 首 赋 
格 曲 ”。 该 书 获得 了 普 利 策 文学 奖 ， 并且， 多 年 来 它 已 成 为 计算 机 科学 的 经 典 著作 之 一 。 这 本 书 的 
魅力 在 于 它 包含 了 数学 上 可 以 用 计算 机 程序 的 形式 来 表达 的 若干 古怪 和 难 解 的 问题 。 最 有 趣 的 一 
个 问题 是 通过 对 一 个 特定 的 正 整 数 n 重复 地 执行 以 下 规则 ， 便 可 形成 一 系列 数 : 
e 如 果 n 等 于 1， 那 么 已 经 到 达 这 个 序列 数 的 终点 ， 可 以 停止 。 
e 如 果 n 是 偶数 ， 将 它 除 以 2。 
e 如 果 n 是 奇数 ,将 它 乘 以 3 再 加 1。 
虽然 这 个 数 序列 有 很 多 名 称 ， 但 通常 称 它 为 冰 埠 序列 (hailstone sequence)， 因 为 这 些 值 忽 上 和 忽 下 ， 
如 冰雹 在 云 中 的 形成 。 
编写 一 个 程序 ， 让 用 户 输入 数据 ， 然 后 从 该 数据 产生 冰雹 序列 ， 如 以 下 程序 运行 结 













Enter a number: 15 
15 is odd, so I multiply by 3 and add 1 to get 46 
23 


B0 is even, so I divide it by 2 to get 40 





40 is even, so I divide it by 2 to get 20 

20 is even, so I divide it by 2 to get 10 

10 is even, so I divide it by 2 to get 5 

5 is odd, so I multiply by 3 and add 1 to get 16 
16 is even, so I divide it by 2 to get 8 

8 is even, so I divide it by 2 to get 4 

4 is even, so I divide it by 2 to get 2 

2 is even, so I divide it by 2 to get 1 


正如 你 所 看 见 的 ， 该 程序 记录 了 它 所 执行 的 每 个 过 程 的 数据 变化 ， 如 Hofstadter 在 他 书 中 描述 的 
那样 。 

冰雹 序列 最 迷人 之 处 是 直到 目前 还 没有 人 证 明 它 最 终 能 停止 。 冰 和 塌 序 列 的 计算 过 程 可 以 有 很 
多 步 ， 但 不 知 何故 ， 它 总 能 跳 回 到 1。 


. 德国 数学 家 莱 布 尼 效 ( 1646 一 1716 ) 发 现 了 一 个 引 人 注 目的 事实 : 数学 常量 r 可 以 用 下 面 的 公式 


计算 : 


] RENE 6 A^ d. xar 
g e legP3 7 t-g TF 


该 等 式 的 右边 代表 了 一 个 无 穷 级 数 ; 每 个 分 数 代表 了 该 级 数 中 的 一 项 。 所 有 奇数 从 1 开始 ， 减 去 三 
分 之 一 ， 加 上 五 分 之 一 ， 以 此 类 推 ， 你 按 上 述 公 式 一 直 做 下 去 ， 所 得 到 的 值 就 会 越 来 越 接近 于 7/4. 
编写 一 个 程序 ， 计 算 包 含 莱 布 尼 效 级 数 的 前 10 000 项 的 m 的 近似 值 。 


. 你 也 可 以 通过 划分 圆 近似 计算 让。 考虑 下 面 的 四 分 之 一 圆 : 


半径 r 等 于 2 英寸 9。 从 圆 面积 公式 中 ， 你 可 以 确定 四 分 之 一 圆 面积 为 平方 英寸 。 你 可 以 通过 增加 


O 1 英寸 =0.0254 米 。 
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一 系列 的 矩形 近似 计算 该 区 域 ， 每 个 矩形 的 宽度 相同 ， 高 度 由 圆 穿 过 和 矩形 上 底 的 中 点 确定 。 例 如 ， 
你 可 以 从 左 到 右 将 这 块 区 域 划分 为 10 个 矩形 ， 得 到 下 面 的 图 : 


所 有 的 矩形 面积 之 和 近似 于 四 分 之 一 圆 。 和 矩形 越 多 ， 其 面积 就 越 接近 于 x 的 近似 值 。 
TR RUE, SEHE w 是 一 个 取决 于 将 半径 分 为 多 少 个 矩形 的 常量 。 男 外 ， 高 度 h 的 变化 依赖 于 矩形 
的 位 置 。 如 果 和 矩形 中 点 的 水 平 距 离 为 x， 和 矩形 的 高 度 可 以 用 平方 根 公 式 计算 得 出 : 


每 个 矩形 的 面积 记 为 hbXw。 
编写 一 个 程序 ， 计 算 将 四 分 之 一 圆 划分 成 10 000 个 矩形 的 面积 。 
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你 的 库 就 是 你 的 乐园 。 
一 一 伊 拉 斯 谈 (Desiderius Erasmus),《 费 合 尔 在 鹿特丹 的 研究 》 
(Fisher's Study at Rotterdam), 1524 


正如 第 1 章 中 的 示例 ，C++ 程序 通常 由 一 系列 图 数 构成 。 本 章 将 深入 地 阐述 函数 的 基 
本 概念 ， 及 其 在 C++ 中 的 具体 实现 思想 。 此 外 ， 本 章 将 探讨 如 何 把 函数 存储 于 库 中 ， 这 使 
得 函数 在 各 种 应 用 开发 中 的 使 用 变 得 更 加 简单 。 


2.1 “函数 概念 


在 学 习 编程 的 早期 阶段 ， 最 重要 的 职责 就 是 学 习 如 何在 编程 中 更 为 有 效 地 使 用 函数 。 
幸运 的 是 ， 编 程 中 函数 的 概念 与 数学 中 的 函数 是 类 似 的 ， 因 此 ， 你 可 以 完全 不 必 从 头 开始 学 
习 这 一 新 概念 。 同 时 ，C++ 语言 中 的 函数 比 数学 中 的 函数 更 加 通用 ， 这 也 意味 着 你 将 不 得 
不 超越 数学 上 的 函数 概念 ， 来 深入 地 思考 你 将 怎样 以 一 个 程序 员 的 身份 去 使 用 函数 。 接 下 
来 的 章节 先 从 数学 上 的 函数 概念 开始 ， 然 后 围绕 着 编程 范围 内 的 函数 应 用 来 进一步 推广 这 一 


2.1.1 数学 中 的 函数 


当 你 在 中 学 学 习 数 学 时 ， 你 肯定 已 接触 过 函数 的 概念 。 例 如 ， 你 可 能 曾经 看 到 过 如 下 的 


函数 定义 : 
f(xy=x? +1 

上 式 表 明了 函数 /是 将 数 x 首先 转换 到 数 x 的 平方 然后 再 加 上 一 的 一 个 变换 。 对 于 x 的 任何 取 
值 ， 你 能 很 容易 地 通过 上 述 函 数 求 值 公式 计算 出 其 函数 值 。 因 此 ，7(G3) 的 值 是 3 十 1， 即 10。 

自从 20 世纪 50 年 代 FORTRAN 语言 诞生 以 来 ， 程 序 设计 语言 已 经 在 其 自身 的 计算 架 
构 中 组 合 了 函数 这 一 数学 方法 。 例 如 ， 通 过 第 1 章 有 关 函 数 的 例子 ， 你 发 现在 C++ 中 可 以 
通过 如 下 语句 实现 函数 了 : 

double f(double x) ( 


return x * x + 1; 


) 
在 上 述 C++ 函数 的 定义 中 ， 虽 然 包 括 了 一 部 分 数学 公式 中 未 出 现 的 语法 ， 但 其 函数 的 基本 
思想 是 一 致 的 。 函 数 £ 通过 变量 x 来 获得 输入 值 并 返回 表达 式 x*x+1 的 值 。 


2.1.2 编程 中 的 函数 


在 程序 设计 语言 中 ， 函 数 的 概念 变 得 比 在 数学 中 更 加 宽泛 。 与 数学 中 的 函数 相对 应 ， 
C++ 中 的 函数 可 以 指定 其 输入 值 ， 虽 然 有 时 并 不 一 定 非 要 如 此 。 同 样 ，C++ PY POR BOR 
一 定 要 返回 结果 。C++ 函数 最 基本 的 特征 就 是 通过 函数 名 与 计算 操作 (一 个 称 为 函数 体 的 代 
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133.) 相关 联 。 一 旦 某 个 函数 被 定义 ,程序 其 他 部 分 就 可 以 仅 通过 使 用 函数 名 来 触发 由 函数 
所 定义 的 计算 操作 ， 而 无 须 重 复 编写 函数 定义 中 计算 操作 中 的 程序 代码 ， 因 为 它们 已 经 在 函 
数 体 中 定义 过 了 。 

为 了 正确 地 理解 C++ 中 的 函数 ， 首 先 定义 在 编程 中 所 用 到 的 几 个 术语 。 函 数 (function) 
是 一 个 被 组 织 成 具有 特定 名 称 的 独立 单元 的 代码 块 。 通 过 使 用 函数 名 来 调用 函数 代码 ( 块 ) 
的 行为 称 为 函数 调用 (calling)。 为 了 调用 C++ 中 的 一 个 函数 ,你 应 该 写 上 函数 名 ,后面 跟 
上 一 对 用 圆 括 号 括 起 来 的 表达 式 列表 。 这 些 表达 式 称 为 函数 的 实 参 (argument)， 它 允许 函数 
调用 者 向 被 调用 函数 传递 信息 。 如 果 一 个 被 调用 函数 不 需要 调用 者 传递 任何 信息 ， 函 数 就 不 
需要 实 参 ,但 是 在 定义 和 调用 这 种 无 实 参 的 函数 时 ， 都 必须 在 函数 名 后 给 出 一 对 空 的 不 含有 
任何 实 参 的 圆 括 号 。 

一 旦 函数 被 调用 ， 函 数 将 获取 函数 实 参 所 提供 的 值 ， 执 行 函 数 的 功能 ( 即 执行 函数 体 
中 的 代码 )， 然 后 返回 程序 的 函数 调用 点 。 记 忆 主 调 程 序 的 工作 情况 以 便 程 序 返 回 函 数 调用 
的 确切 位 置 是 函数 调用 机 制 的 主要 特性 之 一 。 这 种 返回 主 调 程序 的 操作 称 为 从 函数 中 返回 
(returning)。 有 时 在 函数 返回 时 ， 向 函数 调用 者 返回 一 个 函数 值 ， 它 称 为 返回 值 (returning 


a value), 


2.1.3 ”使 用 函数 的 优点 


函数 在 程序 设计 语言 中 扮演 着 重要 的 角色 。 首 先 ， 定 义 函 数 让 编程 人 员 可 以 将 一 段 完 成 
特定 任务 的 操作 代码 仅 编写 一 次 ， 但 可 以 多 次 使 用 。 因 此 ， 将 完成 特定 任务 的 一 系列 代码 组 
织 成 一 个 函数 ,不 仅 可 以 显著 地 降低 程序 的 规模 ， 而 且 使 程序 更 易于 维护 。 如 果 你 要 对 函数 
实现 的 操作 进行 改变 ， 你 会 发 现 只 出 现 一 次 的 代码 会 比 贯 穿 整个 程序 多 次 出 现 的 相同 代码 更 
容易 修改 。 

即使 函数 只 在 程序 中 使 用 了 一 次 ， 定义 这 个 函数 也 是 值得 的 。 函 数 最 主要 的 作用 就 是 
将 一 个 大 型 程序 分 解 成 多 个 易于 管理 的 小 部 分 。 这 一 过 程 称 为 分 解 ( decomposition)。 以 往 
的 编程 经 验 告诉 我 们 ， 将 整个 程序 写成 一 个 庞大 的 代码 块 必然 会 导致 一 场 灾 难 。 而 你 所 需 做 
的 应 是 将 一 个 高 层次 问题 细 分 为 一 系列 低层 次 的 函数 ， 每 一 个 函数 有 其 自己 独立 的 功能 。 然 
而 ， 找 到 问题 正确 的 细 分 方法 有 很 大 的 挑战 ， 需 要 不 断 练习 、 思 考 与 尝试 。 一 个 好 的 、 独 特 
的 细 分 方法 ， 会 使 每 一 个 函数 都 是 一 个 聚合 紧密 的 单元 ， 使 得 问题 整体 更 加 易于 理解 。 如 果 
你 选择 了 一 个 不 好 的 分 解 方法 ， 它 将 会 成 为 你 解决 问题 的 阻碍 。 世 上 并 不 存在 准确 而 快速 的 
法 则 证 你 找到 最 正确 的 问题 分 解 方法 。 编 程 是 一 门 艺术 ， 好 的 问题 分 解 策略 主要 来 源 于 实际 
经 验 。 

然而 ， 作 为 一 种 通用 的 规则 ， 问 题 的 分 解 过 程 一 般 从 程序 的 主 程序 开始 。 此 时 ， 我 们 
将 整个 程序 视 为 一 个 整体 ， 并 尝试 从 中 分 析 并 抓 取 出 其 主要 部 分 。 一 旦 程序 的 最 主要 部 分 被 
识别 出 来 ， 就 可 以 将 它们 定义 为 一 些 相互 独立 的 函数 。 由 于 某 些 函数 可 能 本 身 依然 复杂 ， 因 
Jt, 通常 需要 将 它们 再 分 解 为 更 小 的 部 分 。 我 们 可 以 不 断 重复 这 一 分 解 过 程 直 到 每 个 问题 足 
够 简单 明了 以 便于 解决 。 上 述 分 解 过 程 称 为 自 项 向 下 的 程序 设计 (top-down design) 或 逐步 
求 精 的 方法 (stepwise refinement)。 


2.1.4 ”函数 和 算法 
函数 除了 作为 一 种 管理 程序 复杂 性 的 工具 之 外 ， 在 编程 中 ， 重 要 的 是 ， 函 数 也 为 算 
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ik (algorithm) 的 实现 提供 了 基础 性 的 保障 。 算 法 是 一 种 用 于 解决 计算 问题 的 精确 指定 策 
略 ， 这 一 术语 起 源 于 9 世纪 的 波斯 数学 家 穆罕默德 ， 花 拉 子 米 (Muhammad ibn Musa al- 
Khwarizml) 的 数学 论著 《代数 学 》( Kitab al jabr w’al-mugabala) 中 ， 后 来 产生 了 英文 单词 。 
然而 ， 数 学 算法 的 产生 可 以 追溯 至 历史 上 更 早 的 时 期 ,已 确定 最 早 延 伸 至 古 希腊 、 古 中 国 、 
古 印度 文明 时 期 。 
历史 上 最 著名 的 一 个 数学 算法 是 以 希腊 数学 家 欧 几 里 得 的 名 字 命 名 的 ， 在 托 勒 密 一 世 统 
治 时 期 (公元 前 323 年 一 公元 前 283 年 )， 他 居住 在 亚历山大 。 在 欧 几 里 得 的 数学 著作 《 几 
何 原本 》 中 ， 描 述 了 一 个 求 两 个 整数 x 和 y 最 大 公约 数 (greatest common divisor,gcd) 的 过 程 ， 
即 一 个 可 以 同时 整除 x Aly 的 最 大 整数 的 算法 。 例 如 ,49 和 35 的 gcd 是 7, 6 和 18 的 gcd 
是 6，32 和 33 AY gcd 是 1。 欧 几 里 德 算 法 可 以 描述 如 下 : 
1. 用 x 除 以 y 并 计算 余数 +。 
2. 若 + 等 于 0， 则 算法 结束 ， 最 大 公约 数 是 y. 
3. 若 + 不 等 于 0， 则 仿 x 的 值 为 y, y 的 值 为 -， 重复 该 过 程 。 
你 可 以 很 容易 地 将 上 述 算 法 转换 成 C++ 代码 : 
int gcd(int x, int y) { 
int r =x % y; 
while (r !- 0) { 
x= y; 
y=u; 
r=x ty; 
} 
return y; 
} 
欧 几 里 得 算法 相 比 你 自己 可 能 发 现 的 任何 计算 策略 显得 更 有 效率 ， 而 且 ， 该 算法 至 今 在 
包括 网 络 安全 的 加 密 协议 实现 等 很 多 情况 下 都 得 到 了 广泛 的 应 用 。 
同时 ， 我 们 很 难 清晰 明确 地 看 出 该 算法 为 什么 会 得 到 正确 的 结果 。 幸 运 的 是 ， 对 于 现在 
那些 依赖 于 这 个 算法 的 人 来 说 ， 欧 几 里 得 算法 的 正确 性 已 经 在 《几何 原本 》 第 7 章 命 题 2 中 
得 到 了 证 明 。 虽 然 并 不 是 总 有 证 据 来 证 明 算法 对 计算 机 应 用 的 驱动 作用 ， 但 这 些 证 据 能 让 你 
对 程序 的 正确 性 更 有 信心 。 


2.2 & 


当 你 编写 一 个 C++ 程序 时 ， 计 算 机 执行 的 大 多 数 代 码 并 不 是 你 自己 编写 的 代码 ， 而 是 
你 从 标准 库 中 加 载 到 应 用 程序 中 的 代码 。 不 管 怎样 ， 当 今 的 程序 就 像 海 洋 上 的 一 座 冰 山 ， 其 
大 部 分 体积 隐藏 在 水 面 之 下 。 如 果 你 想 成 为 一 个 高 效 的 C++ 程序 员 ， 那 你 就 必须 至 少 花费 
和 你 学 一 门 语 言 本 身 一 样 多 的 时 间 来 学 习 标 准 库 。 

在 本 书 中 你 所 看 到 的 每 一 个 程序 ， 即 使 是 第 1 章 开 头 的 HelloWorld 小 程序 ， 都 包 
含 标 准 库 <iostream>， 这 个 库 提 供 了 cin M cout 数据 流 。 当 你 写 HeLLloNwWozr1d 和 
PowersOfTwo 程序 时 ， 这 些 流 是 如 何 实现 的 对 你 来 说 并 不 重要 。 事 实 上 ， 这 些 流 的 实现 方 
法 对 于 现在 的 你 来 讲 还 太 过 于 遥远 ， 也 超出 了 本 书 讨论 的 范围 。 作 为 一 个 程序 员 ， 你 所 要 做 
的 就 是 知道 如 何 使 用 这 些 库 来 实现 它们 所 承诺 的 功能 。 

编程 初学 者 有 时 候 会 对 在 不 知 函数 的 底层 实现 情况 下 调用 函数 这 一 概念 感到 不 自然 。 然 
而 ， 事 实 上 ， 在 数学 领域 你 可 能 遇 到 这 种 情况 已 很 入 了 。 上 中 学 时 ， 你 大 概 遇 到 过 一 些 很 有 
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用 的 函数 ， 即 使 你 当时 不 知道 其 原理 也 可 能 没 兴趣 知道 。 例 如 ， 在 你 的 代数 课 上 ， 你 学 习 过 
对 数 函 数 和 平方 根 函 数 。 如 果 你 选修 了 三 角 学 课程 ， 就 会 懂得 正弦 三 角 函 数 和 余弦 三 角 郴 
数 。 想 要 知道 这 些 函 数 的 值 ， 你 无 须 手动 计算 其 结果 ， 只 需要 查询 函数 表 ， 甚 至 可 以 将 合适 
的 值 输入 到 计算 器 里 来 得 到 其 结果 。 

编写 程序 需要 和 上 述 几 乎 一 样 的 策略 。 如 果 你 调用 一 些 数学 函数 ， 那 么 你 要 做 的 会 比 正 
确 地 按 计算 器 相应 的 按键 更 少 。 幸 运 的 是 ，C++ 有 一 个 强大 的 数学 函数 库 ， 称 为 <cmath>， 
它 包含 了 编程 中 所 需要 的 几乎 所 有 的 数学 函数 。 表 2-1 列 出 了 <cmath> 中 最 常用 的 函数 。 
不 用 担心 自己 不 了 解 其 中 一 些 函数 的 功能 ， 本 书 只 需要 很 少 的 数学 知识 ， 并 且 会 对 超出 基本 
代数 内 容 的 概念 进行 说 明 。 


X 2-1 «cmath» 库 中 的 一 些 基本 函数 


通用 数学 函数 
abs (x) 返回 x 的 绝对 值 
sqrt (x) 返回 x 的 平方 根 
floor (x) 返回 小 于 或 等 于 浮 点 数 x 的 最 大 的 整数 值 
ceil(x) 返回 大 于 或 等 于 浮 点 数 x 的 最 小 的 整数 值 
对 数 和 指数 函数 
exp (x) 返回 x 的 指数 函数 值 Ce") 
log (x) 返回 x 的 自然 对 数值 (基数 为 e) 
log10 (x) 返回 x 的 常用 对 数值 (基数 为 10) 
pow (x, y) 返回 x 的 y 次 方 的 值 
ZAAK 
cos (theta) 返回 角 0 的 余弦 值 ， 甚 中 0 为 弧度 ， 可 用 0 * 1/180 转换 成 度 
sin (theta) 返回 弧度 0 BS 1E ACE 
tan (theta) 返回 弧度 0 的 正切 值 
atan (x) 返回 弧度 0 WEDI. BRA m /2~ m 12 之 间 的 9 角 的 弧度 值 
atan2 (yx) 返回 x 轴 与 原点 和 点 (x, y). 所 形成 直线 的 夹 角 的 弧度 值 


每 当 被 程序 包含 的 库 在 程序 中 发 挥 了 作用 时 ， 计 算 机 科学 家 便 称 该 库 导 出 了 服务 。 例 
W, <iostream> 库 导 出 了 cin 和 cout i, <cmath> 库 导 出 了 sqrt 函数 以 及 表 2-1 中 
所 列 出 的 函数 。 

设计 标准 库 的 一 个 目标 就 是 隐藏 底层 的 复杂 实现 细节 。 通 过 导出 sqrt 函数 ，<cmath> 
库 的 设计 者 让 程序 编写 者 更 容易 地 使 用 该 库 。 当 你 调用 sqrt 函数 时 ， 你 不 需要 知道 sqrt 
函数 内 部 是 怎样 运行 的 。 这 些 细节 只 与 <cmath> 库 的 设计 实现 人 员 有 关 。 

懂得 如 何 调用 sart 函数 和 懂得 该 函数 是 如 何 实现 的 ， 这 两 种 能 力 很 大 程度 上 是 相互 独 
立 的 ， 但 这 两 者 都 是 程序 员 应 具备 的 重要 编程 能 力 。 优 秀 的 程序 员 总 是 使 用 那些 自己 对 其 实 
现 毫 无 头绪 的 函数 。 相 反 ， 实 现 库 函 数 的 程序 员 永 远 不 能 预测 库 函 数 的 潜在 用 户 。 

为 了 强调 库 的 实现 者 和 使 用 者 这 两 个 概念 的 不 同 ， 计 算 机 科学 家 为 这 两 种 人 赋予 了 不 同 
的 名 称 。 自 然 地 ， 实 现 了 库 的 程序 员 称 为 库 的 实现 者 ( implementer)。 相 反 地 ， 调 用 库 的 程 
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序 员 称 为 库 的 用 户 ( client)。 当 你 阅读 本 书 时 ， 你 将 有 机 会 同时 从 库 的 实现 者 与 用 户 这 两 个 
角度 来 接触 几 个 不 同 的 库 ， 首 先是 从 用 户 的 角度 ， 然 后 是 从 实现 者 的 角度 。 


2.3 在 C++ 中 定义 函数 


虽然 你 已 经 在 第 1 章 看 到 过 几 个 函数 ， 甚 至 也 尝试 过 自己 编写 一 些 函 数 ， 但 在 深入 研 
究 怎样 高 效 使 用 函数 之 前 ， 你 依然 需要 回 过 头 来 复习 一 下 C++ 语言 中 编写 函数 的 方法 。 在 
C++ 中， 函数 定义 具有 如 下 语法 形式 : 


type name (parameters) ( 
s BOE = 3-5 


} 
在 这 个 例子 中 ，type 是 函数 的 返回 类 型 ，name 是 函数 名 ，parameters 是 以 逗号 分 隔 的 函数 
形 参 列表 ， 它 给 出 了 函数 中 每 个 形 参 的 类 型 和 名 字 。 形 参 是 函数 调用 时 用 以 传递 实 参 的 占 位 
符 。 从 某 些 方面 看 ， 形 参 就 像 一 个 局 部 变量 。 不 同 的 是 ， 每 一 个 形 参 会 自动 地 以 实 参 进 行 初 
始 化 。 如 果 一 个 函数 没有 形 参 ， 则 函数 的 整个 形 参 列表 为 空 。 

函数 体 是 由 若干 语句 及 函数 所 需 的 若干 局 部 变量 的 声明 构成 的 完成 一 定 功能 的 一 个 程序 
块 。 对 于 有 返回 值 的 函数 来 说 ， 至 少 需 要 有 一 条 return 语句 ， 该 语句 通常 具有 如 下 形式 : 

return expression; 
执行 return 语句 会 使 得 函数 当即 将 控制 权 返 回 给 它 的 调用 者 ， 同 时 将 表达 式 的 值 作为 函 
数值 返回 。 

函数 可 以 返回 任何 类 型 的 值 。 例 如 ， 下 面 的 函数 返回 了 一 个 布尔 类 型 的 值 来 表明 参数 n 
是 否 是 一 个 偶数 : 

bool isEven(int n) { 


return n $ 2 == 0; 


) 
一 旦 定义 了 这 个 函数 ， 就 可 以 在 if 语句 中 使 用 它 : 
if (isEven(i)) ... 


正 像 在 第 1 章 里 所 说 的 ， 返 回 布尔 类 型 数值 的 函数 称 为 判定 函数 (predicate function). 

然而 ， 函 数 并 不 一 定 需要 返回 值 。 不 返回 值 只 执行 规定 步骤 的 函数 称 为 过 程 
(procedure)。 以 保留 字 void 作为 函数 的 返回 类 型 来 表明 其 函数 为 一 个 过 程 。 过 程 通 常 在 执 
行 完 函数 体 中 的 语句 后 结束 。 但 是 也 可 以 像 下 面 这 样 使 用 不 带 返 回 值 的 return 语句 来 提 
前 结束 一 个 过 程 的 执行 : 


return; 


2.8.4 函数 原型 


当 C++ 编译 器 在 程序 中 遇 到 函数 调用 时 ， 它 需要 一 些 函 数 的 相关 信息 来 确保 生成 正确 
的 程序 代码 。 在 大 多 数 情况 下 ， 编 译 器 不 需要 了 解 函 数 体 所 包含 的 所 有 语句 。 它 所 需要 了 解 
的 仅 是 函数 所 需要 的 形 参 及 函数 的 返回 值 类 型 。 这 些 信 息 通常 由 函数 原型 (prototype) 提供 ， 
它 由 函数 的 第 一 行 后 跟 一 个 分 号 构成 。 

在 第 1 章 你 已 经 见 过 函数 原型 的 例子 。 例 如 ， 图 1-3 例子 中 的 PowersOfTwo 程序 展示 
f raiseToPower PRAM JUI : 


int raiseToPower(int n, int k); 


60 
61 
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这 一 函数 原型 声明 告诉 编译 器 raiseToPower MM ms 2 T CSF Bik [p] — Th eH 
值 。 在 函数 原型 中 ， 形 参 名 是 可 选 的 ， 但 一 个 好 的 形 参 名 将 有 助 于 提高 程序 的 可 读 性 。 

如 果 函 数 是 先 定义 后 调用 ， 那 就 不 需要 编写 函数 原型 。 一 些 程序 员 喜 欢 将 源 代 码 组 织 成 
低级 函数 代码 在 前 ,调用 低级 函数 的 中 间 函 数 在 中 间 ， 主 程序 代码 在 后 的 形式 。 使 用 这 种 编 
程 风格 可 以 让 你 少 写 几 行 代码 ， 但 是 会 让 代码 的 阅读 者 对 程序 感到 困惑 。 更 糟糕 的 是 ， 这 种 
组 织 代码 方式 与 自 项 向 下 的 程序 设计 风格 是 相悖 的 ， 因 为 他 会 将 更 经 常 使 用 的 函数 放 在 程序 
的 后 面 。 在 本 书 中 ,为 了 让 我 们 可 以 在 任何 地 方 定义 函数 ， 除 主 函 数 以 外 的 每 个 函数 都 会 提 
供 一 个 明确 的 函数 原型 声明 。 


2.3.2 BR 


TE C++ 中 ， 函 数 名 相同 但 函数 的 参数 列表 不 同 是 合法 的 。 当 编译 器 遇 到 调用 函数 的 函 
数 名 指 代 不 唯一 的 情况 时 ， 编 译 器 会 检查 调用 函数 时 所 传 实 参 并 选择 最 适合 的 函数 版 本 。 几 
个 使 用 相同 名 字 的 不 同 版 本 函数 称 为 函数 名 的 重 载 ( overloading)。 函 数 的 形 参 模型 仅 考虑 
其 形 参 数量 及 其 类 型 ， 而 不 考虑 其 形 参 名 称 ， 取 数 的 形 参 模型 称 为 函数 签名 (signature), 

下 面 举 一 函 数 名 重 载 的 实例 ，<cmath> 库 包 含 了 几 个 版 本 的 abs 函数 ， 且 每 一 个 对 应 
一 种 内 置 的 算法 类 型 。 例 如 ， 该 库 包含 的 函数 如 下 : 

int abs(int x) ( 


return (x < 0) ? -x : x; 


) 
也 包含 另 一 个 相同 名 字 的 函数 : 
double abs(double x) ( 


return (x < 0) ? -x : x; 


) 
这 两 个 函数 唯一 的 不 同 在 于 第 一 个 abs 函数 需要 一 个 int 类 型 的 实 参 ， 而 第 二 个 abs K 
数 需要 一 个 double 类 型 的 实 参 。 编 译 器 根据 函数 调用 者 在 调用 函数 时 所 传人 的 实 参 类 型 
来 决定 到 底 调用 哪 一 个 abs 函数 。 因 此 ， 如 果 abs 被 传人 了 一 个 int 类 型 的 实 参 , 编译 
器 将 会 执行 int 参数 的 abs 函数 并 返回 一 个 整 型 值 。 相 反 地 ， 如 果 调 用 时 传人 的 实 参 是 
double 类 型 ， 编 译 器 将 选择 使 用 double 类 型 形 参 的 abs MA. 

函数 重 载 最 主要 的 好 处 就 是 让 程序 员 可 以 更 好 地 追踪 那些 名 字 相 同 、 拥 有 相同 操作 但 在 
应 用 上 有 细微 差别 的 函数 。 在 不 支持 函数 重 载 的 C 语 言 中 ， 在 调用 求 绝 对 值 函 数 时 ， 你 需 
要 记 住 调用 fabs PR BORA HH float 类 型 的 数值 ， 调 用 abs 函数 来 处 理 int 类 型 的 数值 。 
而 在 C++ 中 ， 你 只 需要 记 住 一 个 函数 名 abs 就 可 以 了 。 


2.3.3 ”默认 形 参数 

C++ 可 以 指定 函数 中 的 某 些 形 参 具有 默认 值 。 形 参 变量 依旧 出 现在 函数 的 第 一 行 ， 但 函 
数 声 明 中 已 赋值 的 形 参 可 以 在 函数 调用 时 不 给 其 实 参 值 ， 这 种 具有 默认 值 的 形 参 称 为 默认 形 
参数 (default parameter). 

为 了 表明 一 个 函数 形 参 值 是 可 选 的 ， 你 需要 在 函数 声明 的 时 候 为 其 形 参 赋予 一 个 初始 
值 。 假 如 你 通过 设计 一 组 函数 来 实现 一 个 字 处 理 器 ， 你 可 能 会 像 下 面 这 样 编写 一 个 函数 原型 : 


void formatInColumns (int nColumns = 2); 


d dt Æ 43 





formatInColumns 函数 获取 列 数值 来 作为 其 实 参 ,但 在 函数 原型 声明 中 的 =2 说 明了 这 一 
实 参 有 可 能 在 调用 的 时 候 被 省 略 。 如 果 你 在 调用 该 函数 时 这 样 写 : 

formatInColumns (); 
那么 实 参 ncolumns 的 值 会 自动 初始 化 为 2。 

当 使 用 默认 参数 值 的 时 候 ， 需 要 牢记 以 下 两 点 : 

e 对 函数 默认 值 的 说 明 仅 能 出 现在 函数 声明 中 ， 而 不 能 出 现在 函数 的 定义 中 。 

e 所 有 具有 默认 值 的 形 参 声明 只 能 出 现在 函数 形 参 列表 的 尾部 。 

默认 形 参 值 的 函数 在 C++ 中 存在 过 度 使 用 的 问题 。 通 常 我 们 更 倾向 于 使 用 C++ 中 的 函 
数 重 载 来 完成 与 默认 形 参 相同 的 功能 。 想 象 一 下 ， 为 了 定义 一 个 需要 传人 x 和 y 的 坐标 来 作 
为 参数 的 函数 setInitialLocation, 那么 该 函数 原型 大 概 是 这 样 的 : 

void setInitialLocation(double x, double y); 

现在 假设 想 修改 该 函数 原型 ， 使 得 传人 的 坐标 初始 位 置 是 (0，0 )。 一 种 方法 是 在 函数 
原型 中 给 参数 取 默 认 值 : 

void setInitialLocation(double x = 0, double y - 0); 
这 一 函数 声明 虽然 可 以 达到 预期 的 效果 ,但 是 在 调用 这 一 函数 时 ， 只 传人 一 个 参数 这 一 现象 
会 让 人 迷惑 。 达 成 这 一 目的 一 个 更 好 方法 是 像 下 面 这 样 使 用 函数 的 一 个 重 载 版 本 : 

void setlInitialLocation() ( 


setInitialLocation(0, 0); 
) 


2.4 ”函数 调用 机 制 


尽管 你 可 以 通过 直觉 来 理解 函数 调用 过 程 ， 但 是 详细 学 习 函 数 调用 这 一 过 程 可 以 让 你 更 精 
确 地 理解 C++ 中 函数 调用 时 后 人 台 发 生 的 事 ， 这 一 知识 在 理解 第 7 章 的 递归 函数 时 显得 尤为 有 
用 。 本 章 接 下 来 将 介绍 函数 调用 时 的 细节 ， 并 通过 设计 一 个 简单 的 例子 来 使 这 一 过 程 更 加 明朗 。 


2.4.1 函数 调用 步骤 

当 发 生 函 数 调用 时 ，C++ 编译 器 会 生成 知 干 代码 执行 以 下 操作 : 

1. 主 调 函 数 通 过 将 实 参与 自己 上 下 文中 的 局 部 变量 进行 绑 定 来 计算 每 个 参数 值 。 由 于 实 
参 通常 为 表达 式 ， 因 此 在 函数 调用 时 其 实 参 表 达 式 的 计算 可 能 涉及 操作 符 及 其 他 函数 调用 ; 
在 新 的 函数 开始 执行 之 前 ， 主 调 函 数 会 对 传人 的 实 参 的 合法 性 进行 验证 。 

2. 系统 会 为 新 的 函数 所 需 的 所 有 局 部 变量 (包括 形 参 ) 创建 新 的 存储 空间 。 这 些 变量 将 
被 分 配 在 内 存 中 称 为 栈 帧 (stack frame) 的 区 域 中 。 

3. 每 一 个 实 参 值 被 传人 到 函数 相应 的 形 参 变量 中 。 对 于 包含 多 个 形 参 的 函数 ， 这 些 实 参 
对 形 参 的 值 拷 贝 将 按 对 应 函数 形 参 的 顺序 执行 ; 第 一 个 实 参 被 传 给 第 一 个 形 参 ， 以 此 类 推 。 
如 果 必 要 ， 编 译 器 将 像 变 量 赋值 过 程 一 样 执行 从 实 参 到 函数 形 参 的 数据 类 型 转换 。 举 例 来 
说 ， 如 果 你 向 一 个 需要 double 类 型 形 参 的 函数 传人 了 一 个 int 实 参 值 ， 在 发 生 实 参 到 形 
参 的 值 拷贝 之 前 ， 实 参 整 型 数 将 被 转换 成 函数 形 参 的 浮 点 型 数值 。 

4. 执行 函数 体 中 的 语句 ， 直 到 遇 到 return 语句 或 者 没有 多 余 可 执行 的 语句 。 

5. WR RAA REE, AXN return 语句 表达 式 的 值 将 被 计算 ， 并 作为 函数 值 返 
回 给 主 调 函 数 。 如 果 必 要 ， 编 译 器 将 执行 数值 的 类 型 转换 以 确保 返回 值 符合 被 调 函 数值 的 类 
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型 要 求 。 例 如 ， 如 果 给 返回 值 类 型 为 int 的 函数 返回 了 一 个 浮 点 类 型 的 值 ， 则 该 返回 结果 
的 小 数 部 分 将 会 被 截断 以 形成 一 个 整数 返回 给 主 调 函 数 。 

6. 为 函数 调用 所 创建 的 栈 帧 将 被 删除 。 在 这 一 过 程 中 ， 所 有 的 局 部 变量 将 被 系统 清理 掉 。 

7. 将 函数 返回 值 代入 到 函数 调用 点 位 置 。 

虽然 上 述 函 数 调 用 这 一 过 程 看 起 来 简单 明了 ， 你 可 能 还 是 需要 通过 一 到 两 个 例子 来 更 深 
人 地 理解 函数 调用 。 通 过 阅读 下 一 节 的 例子 将 让 你 领悟 这 一 过 程 ， 更 进一步 说 ， 如 果 你 能 使 
用 自己 编写 的 程序 来 感受 这 一 过 程 的 细节 ,会 有 助 于 理解 这 一 过 程 。 虽 然 你 可 以 在 纸 上 或 者 
黑板 上 模拟 这 一 过 程 ， 但 最 好 设计 一 批 3x5 的 索引 卡片 ， 并 通过 使 用 一 张 卡 片 来 模拟 栈 帧 的 
工作 方式 。 使 用 索引 卡片 模型 的 优点 在 于 你 可 以 创建 索引 卡片 的 栈 帧 ， 并 更 贴近 地 建 模 计 算 机 
的 程序 执行 过 程 。 在 模拟 时 ， 如 果 调 用 函数 就 增加 一 张 卡 片 ， 如 果 函 数 返 回 就 拿 走 一 张 卡片 。 


2.4.2 组 合 函 数 


函数 调用 过 程 可 以 很 容易 地 通过 特定 例子 的 上 下 文 进行 说 明 。 想 象 一 下 你 有 6 枚 硬币 ， 
每 枚 的 面值 分 别 是 一 美 分 、 五 美 分 、 十 美 分 、 二 十 五 美 分 、 五 十 美 分 和 一 美元 。 如 果 你 在 其 
中 随机 选取 2 枚 人 硬币， 一 共有 多 少 种 组 合 呢 ? 图 2-1 列举 出 了 所 有 的 可 能 性 ， 答 案 是 15 种 。 
作为 一 个 计算 机 科学 家 ， 应 该 思考 一 个 更 加 普遍 的 问题 ,给 定 一 个 含有 nn 个 元 素 的 集合 ， 
可 以 从 中 得 到 多 少 个 包含 上 个 元 素 的 子 集 ” 可 以 通过 如 下 组 合 函 数 (combinations function) 
C (n, k) 来 得 到 答案 : 

Cv. B = qx E 

[66] 其 中 ,感叹 号 代表 了 阶乘 函数 ,表明 为 从 1 到 所 指定 的 值 中 所 有 整数 的 乘积 。 


如 果 你 有 6 枚 硬 '& 


D UO! 


I-A 





图 2-1 组 合 函 数 示例 图 


C++ 中 计算 组 合 函 数 的 代码 如 图 2-2 所 示 ， 其 中 主 函 数 从 用 户 那 请 求 n A A, Sa 
显示 函数 C (n, k) 的 值 。 该 程序 的 运行 实例 如 下 : 
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e00. Comb D a 
Enter the number of objects (n): 6 
Enter the number to be chosen (k): 2 


C(n, k) = 15 





正如 你 在 图 2-2 中 看 到 的 ，Combinations 程序 划分 为 三 个 函数 。 主 函数 main 实现 
了 与 用 户 的 交互 界面 。combinations 函数 计算 c (n, k) 的 值 。 最 后 ， 借 用 第 1 章 中 定义 
的 fact 函数 来 计算 所 需要 的 阶乘 结果 。 


File: Combinations.cpp 


This program computes the mathematical function C(n, k) from 
its mathematical definition in terms of factorials. 


ui 


#include <iostream> 
using namespace std; 


/* Function prototypes */ 


int combinations(int n, int k); 

int fact(int n); 

/* Main program */ 

int main() { 
int n, k; 
cout << "Enter the number of objects (n): "; 
cin >> n; 
cout << "Enter the number to be chosen (k): "; 
cin >> k; 
cout << "C(n, k) = " << combinations(n, k) << endl; 
return 0; 


Function: combinations(n, k) 
Usage: int nWays = combinations (n, 


Returns the mathematical combinations function C(n, k), which is 
the number of ways one can choose k elements from a set of size n. 


*/ 


int combinations(int n, int k) ( 
return fact(n) / (fact(k) * fact(n - k)); 


Function: fact (n) 
Usage: int result fact (n) ; 


Returns the factorial of n, which is the product of all the 
integers between 1 and n, inclusive. 


bt 


int fact(int n) { 
int result = 1; 
for (int i= 1; i <= n; i++) ( 
result *= i; 
} 


return result; 





图 2-2 计算 组 合 函 数 的 程序 
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2.4.3 ”追踪 组 合 函 数 执行 过 程 

或 许 我 们 会 对 Combinations 程序 的 功能 感 兴趣 ,但 是 下 面 的 例子 的 目的 在 于 说 明 函 
数 执行 所 包含 的 步骤 。 在 C++ 中 ， 所 有 的 程序 都 从 主 函 数 main 开始 执行 。 为 了 实现 函数 
调用 ， 系 统 (包括 所 使 用 的 操作 系统 和 硬件 ) 会 创建 一 个 栈 帧 来 保持 对 函数 定义 的 局 部 变量 
的 跟踪 。 在 Combinations 程序 中 ，main 函数 定义 了 两 个 变量 , n 和 k， 因 此 栈 帧 中 将 包 
含 存储 这 两 个 变量 的 空间 。 

在 本 书 的 所 有 图 表 中 ， 我 们 使 用 双 划 线 围 成 的 矩形 来 表示 栈 帧 。 每 一 个 栈 帧 图 中 将 显 
示 一 段 程序 源 代码 和 一 个 表示 程序 代码 执行 位 置 的 手指 图 标 ， 以 利于 对 程序 执行 点 的 跟 
踪 。 在 栈 帧 中 也 包含 了 长 方块 来 标记 局 部 变量 。 因 此 ， 在 开始 执行 main PRÉC fif BH 
帧 如 下 图 所 示 : 


int main()( 
int n, k; E 

ti cout << "Enter the number of objects (n): " 
cin >> n; 


cout << "Enter the number to be chosen (k): "; 


cin >> k; 
cout << "C(n, k) = " << combinations (n, k) << endl; 
return 0; 

k n 


oes edi 


从 main 函数 开始 ， 系 统 依 次 执行 语句 ， 在 控制 台 上 输出 提示 ， 读 取 用 户 输入 的 数据 ， 
并 在 栈 帧 中 以 变量 存储 这 些 数据 。 如 果 用 户 输 入 了 像 上 面 示例 一 样 的 数值 ， 那 么 当 程序 执行 
到 如 下 语句 时 栈 帧 的 状态 如 下 图 所 示 : 








int main() ( 
int n, k; 
cout << "Enter the number of objects (n): "; 
cin >> n; 
cout << "Enter the number to be chosen (k): " 
cin >> k; 

te cout << "C(n, k) = " << combinations(n, k) << endl; 
return 0; 

} k 
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在 程序 输出 执行 结果 之 前 ， 它 必须 调用 函数 combinations (nk) 。 此 时 ， 称 main 
函数 将 调用 combinations 函数 ， 这 也 意味 着 计算 机 需要 先 执行 完 调 用 函数 所 需 的 所 有 步 
又 再 输出 。 

函数 调用 执行 的 第 一 步 是 计算 当前 栈 帧 中 参数 的 值 。 变 量 n 的 值 是 6，k 的 值 是 2。 当 
计算 机 建立 combinations 函数 的 栈 帧 时 ， 这 些 参 数值 将 被 传递 给 函数 的 形 参 n 和 k。 虽 
然 main 函数 局 部 变量 在 这 时 候 无 法 访问 ,但 新 的 栈 帧 将 建立 在 储存 了 main 函数 局 部 变量 
参数 值 的 栈 帧 的 上 部 。 建 立 函数 并 初始 化 形 参 变量 后 的 情形 如 下 : 
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为 了 计算 combinations 函数 的 值 ， 程 序 必 须 三 次 调用 fact 函数 。 在 C++ 中 ， 三 次 
fact 函数 的 调用 可 以 以 任意 顺序 执行 ， 但 为 了 简单 起 见 ， 我们 从 左 到 右 依 次 调用 fact K 
数 。 因 此 ， 第 一 次 是 调用 fact (n) ， 为 了 计算 其 函数 值 ， 系 统 必 须 创 建 另 外 一 个 栈 帧 ， 以 
下 是 向 fact 函数 中 传人 数值 6 的 情形 : 


(um fact (int n) ( 
ey int result = 1; 
for (int i = 1; i <= n; itt) { 
result *= i; 
} 


return result; 





不 像 之 前 的 栈 帧 ，fact 函数 的 栈 帧 中 同时 包含 了 形 参 和 局 部 变量 。 形 参 n 通过 调用 时 
传人 的 数值 6 被 初始 化 。 而 函数 中 的 两 个 局 部 变量 i 和 result 此 时 还 没有 被 初始 化 。 尽 
管 如 此 ， 系 统 还 是 在 栈 帧 中 为 它们 保留 了 存储 空间 。 直 到 给 它们 赋值 之 前 ， 它 们 将 包含 之 前 
赋予 其 中 的 不 可 预测 的 值 一 一 随机 数 。 因 此 ， 必 须 牢记 在 使 用 局 部 变量 前 应 对 它们 进行 初始 
化 ， 当 然 ， 最 理想 的 情况 是 在 声明 时 对 它们 进行 初始 化 。 

接 下 来 系统 会 执行 fact 函数 中 的 语句 。 在 这 一 实例 中 ，for 循环 体 被 执行 了 6 次 。 在 
每 一 次 循环 中 ， 变 量 result 的 值 都 乘 以 循环 变量 i ， 这 意味 着 result 变量 最 后 的 值 是 
720 (1X2X3X4X5X6， 即 61 )。 当 程序 执行 到 return 语句 时 ， 栈 帧 状态 如 下 所 示 : 


int combinations(int n, int k) { 
int fact(int n)( 
int result - 1; 
for (int i = 1; i <= n; i++) { 
result *- i; 


} 
uy return result; 





在 上 述 示意 图 中 ,代表 变量 i 的 方 框 内 是 空 的 ， 因 为 i 的 值 还 没有 定义 。 在 C++ 中 ,循环 
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变量 在 for 语句 中 定义 ， 它 也 只 在 for 语句 体 中 有 效 。 以 空 方 框 来 代表 i 强调 了 i 此 时 还 
无 法 访问 。 

从 一 个 函数 返回 涉及 将 return 表达 式 的 值 ( 即 局 部 变量 result 的 值 ) 传 回 函 数 调用 点 
这 一 操作 。 之 后 ，fact 函数 的 栈 帧 被 删除 ， 这 将 导致 浮 数 进入 以 下 状态 : 


int combinations(int n, int k) { 
return [fact (n)] / ( fact(k) * fact(n - k) ); 


720 





这 个 过 程 的 下 一 步 是 进行 fact 函数 的 第 二 次 调用 ， 此 时 首先 计算 参数 k， 然 后 在 调用 


时 用 x 的 值 2 初始 化 新 栈 帧 中 的 参数 n。 其 示意 图 如 下 所 示 : 


t combinations (int n, int k)( 


int fact(int n)( 
us int result = 1; 
for (inti = 1; i <= n; i++) { 
result *- i; 
) 
return result; 


) 


result n 





fact(2) 的 计算 比 之 前 介绍 的 fact (6) 的 计算 要 简单 许多 。 在 执行 完成 时 ，result 
变量 的 值 是 2， 且 这 一 数值 像 下 面 一 样 会 被 传 回 函数 调用 点 : 


t. 720 2 





combinations 函数 会 第 三 次 调用 fact 函数 ， 这 一 次 其 函数 参数 为 n-k。 像 之 前 一 
样 ， 系 统 会 为 本 次 函数 调用 创建 包含 值 为 4 的 变量 n 的 栈 帧 : 
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int combinations (int n, int k) { 
int fact(int n)( 
g int result = 1; 
for (int i= 1; i <= n; i++) { 
result *= i; 


} 


return result; 


) 


result n 





fact (4) 的 值 是 1X2x3X4， 即 24。 但 本 次 调用 返回 时 ， 系 统 便 可 以 填写 该 程序 所 需 


int cosbinations (int n, int k)| - n, int k)( 


eg a cut =a 
720 





计算 机 接 下 来 会 将 720 除 以 2 和 24 的 乘积 ， 得 到 结果 15。 这 一 数值 会 被 返回 到 main 
函数 中 ， 使 得 main 图 数 处 于 如 下 状态 : 


int main() { 
int n, k: 
cout «« "Enter the number of objects (n): " 
cin >> n; 
cout << "Enter the number to be chosen (k): " 


cin >> k; 


cout << "C(n, k) = " ««|combinations (n, k)| << endl; 


return 0; 


IS, A 


1.9 1) €] 


从 此 刻 开 始 ， 所 要 做 的 事 就 只 剩 下 处 理 输出 ， 并 从 main 函数 返回 以 结束 程序 的 执行 


25 引用 参数 


在 C++ 中 ， 当 你 从 一 个 函数 向 另 一 个 函数 传递 一 个 普通 变量 时 ， 被 调 函 数 将 获得 一 个 
调用 函数 的 值 拷 贝 。 被 调 函 数 中 所 传人 的 实 参 变量 值 仅 改变 被 调用 函数 局 部 形 参 的 值 ， 但 对 
主 调 函 数 中 实 参 变量 的 值 将 不 会 有 任何 影响 。 例 如 ， 如 果 你 执行 以 下 代码 ， 将 一 个 变量 值 初 
始 化 为 0: 
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void setToZero(int var) ( A 
var = 0; 
} 


但 是 如 果 你 如 下 调用 函数 ， 这 段 代 码 的 执行 将 不 会 对 变量 x 的 值 有 丝毫 影响 : 
setToZero(x); 

不 管 x 存储 的 值 为 多 少 ， 都 将 使 用 x 的 值 拷贝 来 初始 化 参数 var。 以 下 赋值 语句 : 
var = 0; 


将 把 函数 中 局 部 变量 值 设 置 为 0， 但 不 会 改变 主 调用 程序 中 x 的 值 。 

如 果 你 想 要 改变 主 调 函 数 中 实 参 的 值 (实际 中 也 经 常 需要 这 么 做 )， 你 可 以 将 形 参 类 型 
从 普通 的 C++ 值 参数 (value parameter) 改变 为 引用 参数 (reference parameter)。 引 用 参数 
是 在 参数 类 型 与 参数 名 中 间 加 一 个 “及 ”。 与 值 参 数 不 同 ， 引 用 参数 在 函数 调用 时 并 不 是 实 
参 值 对 形 参 的 值 拷 贝 ， 而 实际 上 形 参 接受 的 是 对 实 参 的 一 个 引用 ， 这 也 意味 着 主 调 函 数 和 被 
调 函 数 是 共享 实 参 变量 的 统一 存储 空间 的 。setToZero 函数 的 改进 版 本 如 下 : 

void setToZero(int & var) ( 


var = 0; 


) 

上 述 函 数 调 用 的 参数 传递 风格 被 称 为 引用 调用 (call by reference)。 当 采用 引用 调用 时 ， 
对 应 于 引用 形 参 的 实 参 必须 为 可 赋值 的 量 ， 例 如 变量 名 。 虽 然 调用 setTozero (x) 能 正确 地 
把 x 的 值 置 为 0, 但 是 像 setTozero (3) 这 样 的 调用 却 是 非法 的 ， 因 为 3 是 不 能 被 引用 赋 
值 的 。 

在 C++ 中 ， 最 常 使 用 引用 调用 的 情况 是 函数 需要 返回 多 于 一 个 值 的 情况 。 我 们 可 以 很 容易 
地 将 单个 值 作为 函数 的 值 返回 。 但 如 果 你 试图 从 函数 中 返回 多 个 值 ， 返 回 值 的 方法 将 不 再 适 
用 。 最 标准 的 解决 方法 是 将 函数 转换 为 一 个 过 程 并 通过 实 参 列表 向 函数 传递 及 从 函数 返回 数值 。 

例如 ， 假 设 你 想 编写 一 个 解 一 元 二 次 方程 式 的 程序 : 


ax + bx +c=0 


为 了 有 一 个 好 的 编程 风格 ,你 可 把 这 个 程序 结构 按 以 下 流程 图 设计 为 三 部 分 : 


输入 阶段 : 
从 用 户 处 接收 系数 的 值 


“We 









输出 阶段 : 
在 屏幕 上 显示 输出 
二 次 方程 的 根 

图 2-3 所 示 的 Quadratic 程序 向 我 们 展示 引用 调用 是 如 何 将 一 个 计算 二 次 方程 的 程 
序 分 解 为 这 种 形式 的 。 图 2-3 中 所 示 的 每 个 函数 都 各 自 对 应 着 流程 图 中 的 一 个 阶段 。 主 程 
序 使 用 值 参 向 被 调 函 数 传 递 信息 。 当 被 调 函 数 向 主 程序 返回 值 时 ， 该 函数 将 返回 一 个 引用 。 
solveQuadratic 函数 分 别 使 用 了 值 参 和 引用 两 种 类 型 的 形 参 。 其 中 , 形 参 a、b 和 c 传 
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入 的 是 值 参 ， 代 表 了 二 次 方程 的 三 个 系数 ， 而 形 参 x1 和 x2 是 引用 参数 用 以 输出 函数 的 返 
回 值 ， 即 允许 程序 传 回 二 次 方程 的 两 个 根 。 

Quadratic 程序 还 引入 了 一 种 新 的 报告 错误 的 方法 。 一 旦 程序 的 输入 无 法 使 程序 正 
确 执 行 ， 程 序 将 调用 error 函数 在 输出 设备 上 打印 出 问题 的 详细 信息 并 终止 程序 的 执行 。 
error 函数 的 代码 如 下 所 示 : 


void error(string msg) ( 
cerr << msg << endl; 
exit (EXIT_FAILURE) ; 

} 


error 函数 的 代码 使 用 了 本 书 还 未 曾 列 出 的 两 个 C++ 的 新 特性 : cerr 输出 流 和 exit P 
数 。 cerr 输出 流 与 cout 相似 ,但 被 用 以 报告 错误 。exit 函数 可 以 即刻 终止 主 程序 的 执行 ， 
使 用 形 参 值 来 报告 程序 现在 的 状态 。 常 量 EXIT FAILURE 在 <cstdlib> 库 中 被 定义 ， 用 
来 说 明 发 生 了 某 种 类 型 的 错误 。 


File: Quadratic.cpp 


If a is 0 or if the equation has no real roots, the 
* program prints an error message and exits. 


wy 


#include <iostream> 
#include <cstdlib> 
#include <cmath> 
using namespace std; 


/* Function prototypes */ 


void getCoefficients(double & a, double & b, double & c); 
void solveQuadratic(double a, double b, double c, 
double & xl, double & x2); 
void printRoots (double x1, double x2); 
void error(string msg); 


/* Main program */ 


int main() ( 
double a, b, c, rl, r2; 
getCoefficients(a, b, c); 
solveQuadratic(a, b, c, rl, r2); 
printRoots (rl, r2); 
return 0; 


Function: getCoefficients 
Usage: getCoefficients(a, b, c); 


Reads the coefficients of a quadratic equation into the 
reference parameters a, b, and c. 


void getCoefficients(double & a, double & b, double & c) ( 
cout «« "Enter coefficients for the quadratic equation:" «« endl; 
cout << "a: "; s 
cin »» a; 
cout «« "b: 
cin »» b; 
cout «« "c: 
cin »» c; 





图 2-3 解 二 次 方程 的 程序 
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Function: solveQuadratic 
Usage: solveQuadratic(a, 


Solves a quadratic equation for the coefficients a, b, and c. The 
roots are returned in the reference parameters xl and x2. 


void solveQuadratic(double a, double b, double c, 
double & xl, double & x2) ( 

if (a == 0) error("The coefficient a must be nonzero."); 
double disc =b*b-4* a* c; 

if (disc « 0) error("This equation has no real roots."); 
double sqrtDisc = sqrt (disc) ; 

xl = (-b + sqrtDisc) / (2 * a); 

x2 = (-b - sqrtDisc) / (2 * a); 


Function: printRoots 
Usage: printRoots (x1, 
* 


Displays xl and x2, which are the roots of the quadratic equation. 
xf 


void printRoots (double x1, double x2) { 
if (xl == x2) { 
cout << "There is a double root at " << xl << endl; 
} else { 
cout << "The roots are " << xl << " and " << x2 << endl; 


} 


Function: error 
Usage: error (msg); 


Writes the string msg to the cerr stream and then exits the program 
with a standard status value indicating that a failure has occurred. 


void error(string msg) { 
cerr << msg << endl; 
exit (EXIT_FAILURE) ; 





) 
图 2-3 (8) 


HR, error 函数 在 除了 解 二 次 方程 程序 之 外 的 其 他 程序 中 也 能 起 到 重要 作用 。 虽 然 
你 可 以 很 容易 地 将 代码 复制 到 另 一 个 程序 ， 但 如 果 将 error 函数 写 和 人 库 中 会 更 加 方便 。 在 
下 面 的 章节 中 ， 你 将 有 机 会 尝试 这 一 做 法 。 


2.6 接口 与 实现 


当 你 定义 一 个 C++ 库 时 ， 你 需要 提供 库 的 两 个 部 分 。 首 先 ， 你 必须 定义 接口 ( interface)， 
它 可 以 让 库 用 户 在 不 了 解 库 实 现 细 节 的 情况 下 使 用 库 中 的 库 函 数 。 第 二 ， 你 需要 定义 库 
的 具体 实现 (implementation)， 它 说 明 库 的 底层 实现 细节 。 一 个 典型 的 接口 可 以 提供 多 种 
定义 ,包括 函数 定义 、 类 型 定义 和 常量 定义 。 每 一 个 定义 都 称 为 一 个 接口 条 目 (interface 
entry). 

在 C++ 中， 接口 和 实现 通常 写 在 两 个 不 同 的 文件 中 。 定 义 接口 的 文件 后 缀 名 是 n, d 
称 为 头 文件 。 定 义 实现 的 文件 取 同 样 的 名 字 ， 但 其 后 缀 名 为 . cpp。 根据 这 些 原则 ，error 
库 将 在 error .h 中 定义 ， 并 在 error .cpp PLA. 
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2.6.1 定义 error — 


图 2-4 中 的 程序 给 出 了 error.h 库 接口 的 内 容 。 就 像 你 所 看 到 的 ，error.h P & 
含 了 大量 的 注释 。 在 其 接口 部 分 只 包括 了 error 函数 的 函数 原型 还 有 三 行 称 为 接口 模板 
(interface boilerplate) 的 内 容 ， 即 函数 预 编 译 头 ， 这 些 预 编 译 头 在 每 个 库 接 口中 都 会 出 现 。 
预 编译 头 包 括 了 开始 的 #ifndef 和 #define 指令 ， 以 及 在 结尾 处 对 应 的 #endif 指令 。 这 
些 代码 行 确保 了 编译 器 不 会 重复 编译 同样 的 接口 。#ifndef 指令 检查 _error_h 标志 是 否 
已 被 定义 。 当 编译 带 第 一 次 读 取 这 一 语句 时 ， 检 查 的 结果 将 是 假 的 。 然 而 在 下 一 行 ， 将 定义 
这 一 标志 s。 因此， 如 果 编 译 器 在 接 下 来 有 访问 同一 接口 的 动作 ， 此 时 的 _error_h 标志 已 
经 被 定义 ， 这 一 次 编译 器 将 跳 过 接口 的 定义 。 在 本 书 中 ，#ifndef 行 的 标志 通常 由 下 划 线 
开始 ， 接 下 来 是 接口 文件 名 ， 文 件 名 其 中 的 点 将 被 下 划 线 代替 。 

yx 


* File: error.h 
* 


* This file defines a simple function for reporting errors. 
"g 


#ifndef _error_h 
#define _error_h 


j* 
* Function: error 
* Usage; error (msg); 


* Writes the string msg to the cerr stream and then exits the program 

* with a standard status code indicating failure. The usual pattern for 
* using error is to enclose the call to error inside an if statement that 
* checks for a particular condition, which might look something like this 
* 

* if (divisor --.0) error("Division by zero") 


By 


void error (std::string msg); 





#endif 
图 2-4 error 库 接口 


R, error 的 函数 原型 定义 与 普通 的 函数 定义 有 细微 不 同 。 在 error 函数 的 形 参 声 
明 时 ， 使 用 了 类 型 名 std::string 来 说 明 string 类 型 来 自 于 命名 空间 std。 接 口 一 般 
来 说 是 在 代码 行 using namespace std 之 前 读 取 的 ， 因 此 如 果 不 使 用 std: : 修饰 符 来 
明确 表示 ， 我 们 将 不 能 使 用 命名 空间 中 的 标识 符 。 

图 2-5 是 error .cpp 的 实现 。 该 实现 文件 中 的 注释 用 于 程序 员 维 护 库 时 使 用 ， 通常 这 
种 注释 也 比 接口 文件 中 的 注释 更 少 。 在 这 里 ，error 函数 体 仅 有 两 行 ， 每 一 行 的 作用 对 于 
任何 C++ 程序 员 来 说 都 可 谓 一 目 了 然 。 


/* 


* File: error.cpp 


* This file implements the error.h interface. 


wf 


#include <iostream> 
#include <cstdlib> 
#include <string> 
#include "error.h" 
using namespace std; 





/* 
图 2-5 error 库 的 实现 
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* This function writes out the error message to the cerr stream an 
* then exits the program. The EXIT FAILURE constant is defined in 
* «cstdlib» to represent a standard failure code. 


+7 


void error(string msg) { 
cerr << msg << endl; 
exit (EXIT_FAILURE) ; 

} 





图 2-5 (£2 


2.6.2 ”导出 数据 类 型 


前 面 章 节 介绍 的 exror.h 接口 中 只 有 一 个 函数 。 实 际 上 ，C++ 中 大 多 数 的 接口 中 还 会 
存在 多 个 数据 类 型 。 这 些 类 型 大 多 数 为 类 ， 而 类 是 C++ 提供 的 面向 对 象 编程 的 基础 。 在 第 6 
章 之 前 ， 你 不 会 学 到 如 何 定义 自己 的 类 ， 所 以 在 这 里 举 有 关 类 的 例子 还 为 时 过 早 。 为 了 便于 
理解 ， 我 们 通过 建立 一 个 接口 输出 第 1 章 介绍 过 的 枚 举 类 型 ， 正 如 下 面 的 Direction 类 型 
可 以 被 用 来 编码 指南 针 的 四 个 方向 : 

enum Direction ( NORTH, EAST, SOUTH, WEST }; 

实现 这 一 数据 类 型 的 最 简单 方法 就 是 定义 一 个 只 包含 这 一 数据 类 型 定义 和 预 编 译 头 的 
direction.h 接口 。 如 果 你 采用 了 这 一 方法 ， 则 无 须 提供 这 一 接口 的 实现 。 

然而 ， 如 果 这 个 接口 输出 一 些 简 单 的 函数 来 操作 Direction 值 ， 将 会 使 得 这 个 接 
口 更 好 用 。 例 如 ， 输 出 1.8.4 节 定义 的 directionToString 函数 将 是 一 个 很 好 的 选 
择 ， 这 个 函数 返回 了 一 个 枚 举 类 型 的 值 以 代表 方向 。 在 本 书 接 下 来 的 一 些 程序 里 ， 定 义 的 
函数 leftFrom 和 LightErom 将 非常 有 用 ， 它 们 可 使 Direction 值 的 方向 从 特定 方 
向 旋转 90 度 ， 例 如 ， 调 用 leftFrom (NORTH) 将 返回 WEST。 如 果 你 将 上 述 函 数 加 入 到 
direction.h 接口 中 ， 则 必须 提供 direction .cpp 文件 来 实现 这 些 函 数 。 图 2-6 和 图 2-7 
列 出 了 这 些 文件 。 

函数 leftFrom Ml rightFrom 的 实现 有 一 些微 妙 的 步骤 需要 我 们 对 此 进行 进一步 讲 
解 。 虽 然 C++ 允许 将 枚 举 类 型 自动 转换 为 整数 类 型 ， 但 是 从 整数 类 型 转换 为 枚 举 类 型 时 需 
要 类 型 转换 。 这 种 类 型 转换 可 以 通过 rightFrom 的 实现 来 说 明 : 


Direction rightFrom(Direction dir) { 
return Direction((dir + 1) $ 4); 


/* 


* File: direction.h 
* 


* This interface exports an enumerated type called Direction whose 
* elements are the four compass points: NORTH, EAST, SOUTH, and WEST. 
*/ i 


#ifndef _direction_h 
#define direction h 


#include <string> 
/* 


* Type: Direction 





图 2-6 direction 库 的 接口 
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* This enumerated type is used to represent the four compass directions. 


ay 
enum Direction ( NORTH, EAST, SOUTH, WEST ); 
/* 


* Function: leftFrom 
* Usage: Direction newdir leftFrom(dir); 


* Returns the direction that is to the left of the argument. 
* For example, leftFrom(NORTH) returns WEST. 
¥/ 


Direction leftFrom(Direction dir); 


/* 
Function: rightFrom 
Usage: Direction newdir rightFrom(dir); 


Returns the direction that is to the right of the argument. 
* For example, rightFrom(NORTH) returns EAST. 
ey 


Direction rightFrom (Direction dir); 
/* 


* Function: directionToString 


* Usage: string str - directionToString (dir); 
* 


* Returns the name of the direction as a string. 


*/ 
std::string directionToString(Direction dir); 


#endif 





图 2-6 (4) 


* This file implements the direction.h interface. 


xj 


#include <string> 
finclude "direction.h" 
using namespace std; 


/* 

* Implementation notes: leftFrom, rightFrom 

* 
These functions use the remainder operator to cycle through the 
internal values of the enumeration type. Note that the leftFrom 
function cannot subtract 1 from the direction because the result 
might then be negative; adding 3 achieves the same effect but 
ensures that the values remain positive. 


/ 


Direction leftFrom(Direction dir) { 
return Direction((dir + 3) * 4); 
) 


Direction rightFrom(Direction dir) { 
return Direction((dir + 1) % 4); 


Implementation notes: directionToString 


* Most C++ compilers require the default clause to make sure that this 
function always returns a string, even if the direction is not one 
* of the legal values. 





[2-7 direction 库 的 实现 
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string directionToString(Direction dir) ( 
switch (dir) ( 
case NORTH: return "NORTH"; 
case EAST: return "EAST"; 
case SOUTH: return "SOUTH"; 


case WEST: return "WEST"; 
default: return "???"; 


) 





图 2-7 (4) 
在 以 下 算术 运算 表达 式 中 : 
(dir + 1) % 4 


操作 符 将 自动 把 Direction 值 转换 到 对 应 方向 的 整 型 值 : 0 代表 NORTH，1 代表 EAST, 
2 代表 SOUTH, 3 代表 WEST。 从 其 中 一 个 方向 向 右 旋 转 方向 需要 将 其 值 加 一 ， 但 从 WEST 
向 右 旋转 时 例外 ， 需 要 将 方向 值 循环 到 代表 北 的 数值 0。 在 循环 类 型 的 数据 结构 中 ， 这 
是 经 常 发 生 的 事 ， 因 此 经 常 使 用 求 余 符号 来 代替 特殊 情况 时 对 函数 的 测试 。 然 而 ， 在 
函数 返回 值 之 前 ， 还 需要 将 表达 式 求 得 的 值 转换 成 rightFrom 函数 定义 的 返回 类 型 
Direction. 
因为 存在 使 用 求 余 符 号 计算 负数 的 危险 ， 所 以 left Prom 函数 不 能 像 下 面 这 样 定义 : 
Direction leftFrom(Direction dir) ( M 
return Direction((dir - 1) % 4); 
) 
当 你 调用 leftFrom (NORTH) 时 ， 上 述 函 数 将 出 现 错误 ， 但 当 变量 dir 的 值 是 NORTH HT, 
以 下 表达 式 : 


(dir = 1) $4 


在 大 多 数 机 器 上 将 得 到 值 一 1， 这 不 是 Direction 类 型 的 一 个 合法 值 。 幸 运 的 是 ， 我 们 可 
以 通过 以 下 定义 的 lett From 函数 来 解决 这 一 问题 : 
Direction leftFrom(Direction dir) { 


return Direction((dir * 3) $ 4); 
) 


2.6.3 “导出 常量 定义 


接口 除了 可 导出 函数 定义 和 类 型 定义 ， 还 经 常 可 导出 常量 定义 ,这样 做 可 以 使 多 个 用 户 
共享 这 一 常量 而 不 用 在 每 个 文件 中 重新 定义 它 。 例 如 ， 当 你 编写 有 关 几 何 计算 的 程序 时 ， 定 
义 数学 常量 是 非常 有 用 的 ， 按 照 约 定 俗 成 的 习惯 ， 通 常会 将 常量 名 写 为 PI。 如 果 你 像 第 1 
章 那 样 声明 常量 PI， 则 可 写成 : 


const double PI = 3.14159265358979323846; 


在 C++ 中 ， 像 这 样 定义 的 常量 在 源 文件 中 是 私有 的 常量 ， 它 不 能 从 接口 中 导出 。 为 

了 从 接口 中 能 导出 常量 PI， 需 要 在 其 接口 的 常量 定义 声明 和 原型 声明 中 都 加 上 关键 字 

extern, MW 2-8 所 示 的 gmath .h 接口 ， 这 一 接口 导出 PI 和 一 些 简单 的 函数 来 处 理 以 度 
表示 的 角度 。 其 对 应 的 实现 如 图 2-9 所 示 。 
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File: gmath.h 


This file exports the constant PI along with a few degree-based 
trigonometric functions, which are typically easier to use tha 
their radian-based counterparts in <cmath>. 


#ifndef _gmath_h 
#define _gmath_h 


/* Constants */ 
extern const double PI; /* The mathematical constant pi */ 


/* 
Function: sinDegrees 
Usage: double sine = sinDegrees (angle); 


Returns the trigonometric sine of angle expressed in degrees. 
ag 
double sinDegrees (double angle); 
/* 
* Function: cosDegrees 


* Usage: double cosine - cosDegrees (angle); 
* 


* Returns the trigonometric cosine of angle expressed in degrees. 


bal 
double cosDegrees (double angle); 
/* 


Function: toDegrees 
Usage: double degrees - toDegrees (radians); 


Converts an angle from radians to degrees. 
we 
double toDegrees (double radians); 
/* 


* Function: toRadians 
* Usage: double radians toRadians (degrees); 


Converts an angle from degrees to radians. 


double toRadians (double degrees); 


#endif 





Al 2-8 gmath 库 简 化 的 接口 


This file implements the gmath.h interface. In all cases, the 
implementation for each function requires only one line of code, 
which makes detailed documentation unnecessary. 


x 
#include <cmath> 


#include "gmath.h" 
extern const double PI = 3.14159265358979323846; 


double sinDegrees(double angle) { 
return sin(toRadians (angle) ); 





图 2-9 gmath 库 的 实现 


) 


double cosDegrees (double angle) { 
return cos (toRadians (angle)); 


) 
double toDegrees (double radians) ( 


return radians * 180 / PI; 
) 


double toRadians (double degrees) { 
return degrees * PI / 180; 





图 2-9 (4) 


2.7 接口 设计 原则 


程序 设计 的 一 个 难点 是 程序 需要 考虑 到 底层 应 用 的 复杂 性 。 随 着 计算 机 处 理 的 问题 越 来 
越 复杂 ， 程 序 也 会 变 得 越 来 越 复 杂 难 懂 。 

编写 一 个 处 理 大 型 或 复杂 问题 的 程序 将 迫使 你 面 对 越 来 越 惊 人 的 程序 复杂 性 的 增长 。 有 
许多 算法 需 设 计 ， 许多 特殊 情况 需 处 理 ， 用 户 的 需求 需 满足 ， 以 及 大 量 细节 问题 需要 兼顾 。 
为 了 提高 程序 的 可 管理 性 ， 你 必须 尽 你 所 能 地 降低 程序 的 复杂 性 。 函 数 可 以 降低 一 部 分 程序 
复杂 度 ; 类 库 也 提供 了 同样 可 用 于 降低 复杂 性 的 方法 ,但 同时 也 需要 你 在 建 库 时 考虑 更 多 的 
细节 。 函 数 向 调用 者 提供 了 能 完成 特定 功能 的 一 组 操作 集 。 类 库 向 用 户 提供 了 一 组 函数 和 数 
据 类 型 ， 以 实现 计算 机 科学 家 所 描述 的 编程 抽象 ( programming abstraction ) 。 一 个 特定 的 抽 
象 能 多 大 程度 地 简化 程序 取决 于 你 可 以 多 好 地 设计 接口 。 

为 了 设计 一 个 高 效 的 接口 ， 你 必须 平衡 多 个 方面 的 需求 。 通 常 ， 你 应 该 以 下 面 的 准则 来 
尝试 构建 接口 : 

e 统一 性 (unified)。 一 个 接口 必须 依照 一 个 统一 的 主题 来 定义 一 致 的 抽象 。 如 果 某 个 
函数 不 符合 这 一 主题 ， 就 必须 使 用 其 他 方法 来 重新 定义 这 一 函数 。 
简单 性 (simple)。 库 的 底层 实现 是 复杂 的 ， 但 是 库 的 接口 必须 向 用 户 隐藏 这 种 复 
杂 性 。 
充分 性 〈sufficient)。 当 用 户 使 用 一 种 抽象 时 ， 接 口 必须 提供 足够 的 功能 来 满足 用 户 
的 需求 。 如 果 接 口 缺少 一 些 关键 功能 ， 用 户 可 能 会 拒绝 使 用 并 自己 开发 更 好 的 库 。 
与 简单 性 同样 重要 ， 库 的 设计 者 必须 避免 在 简单 化 过 程 中 使 得 库 的 功能 大 大 减少 。 
通用 性 〈general)。 一 个 良好 设计 的 接口 必须 有 高 度 的 适用 性 ， 它 可 以 满足 不 同 用 户 
的 需求 。 一 个 只 为 特定 用 户 提 供 的 小 范围 操作 集 的 库 ， 其 可 用 性 将 大 大 低 于 一 个 可 
以 在 多 种 情况 下 使 用 的 库 。 
稳定 性 (stable)。 接 口中 定义 的 函数 在 底层 实现 改变 时 ， 也 必须 拥有 一 丝 不 变 的 函数 
接口 结构 和 函数 功能 。 函 数 功 能 的 改变 将 迫使 用 户 向 接口 的 变化 受 协 并 修改 程序 。 
下 面 ， 将 详细 讨论 上 述 的 接口 设计 准则 。 


2.7.1 统一 主题 的 重要 性 
团结 就 是 力量 。 


一 一 伊 索 ,《 一 捆 柴 枝 》 一 公元 前 600 年 
设计 良好 的 接口 所 应 具备 的 核心 特征 是 该 接口 体现 了 一 个 统一 的 、 一 致 的 抽象 。 从 
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某 种 程度 上 说 ， 这 一 库 设 计 标准 反映 了 库 中 选择 的 函数 必须 拥有 一 个 一 致 的 主题 。 因 此 ， 
«cmath» 库 提 供 了 数学 函数 ，<iostream> 库 提 供 了 cin, cout 和 cerr 数据 流 以 及 执 
行 输入 输出 操作 符 ，2.6 节 介 绍 的 error.h 接口 提供 了 一 个 报告 错误 的 函数 。 这 些 库 提供 
的 每 一 个 接口 入 口 都 符合 接口 的 主题 。 例 如 ， 你 不 会 让 <string> 库 提供 sqrt 函数 ， 因 
为 sart 函数 更 加 符合 <cmath> 库 的 主题 框架 。 

统一 主题 原理 也 对 库 接口 中 的 函数 设计 产生 影响 。 在 一 个 接口 中 的 函数 应 该 尽 可 能 在 功 
能 上 表现 出 一 致 性 。 例 如 ，<cmath> 库 中 函数 处 理 的 角度 值 用 弧度 表示 。 如 果 有 一 些 函 数 
使 用 度数 表示 角度 值 ， 用 户 就 不 得 不 去 记 住 每 个 函数 要 使 用 的 参数 的 单位 。 


2.7.2 简单 性 与 信息 隐藏 原理 


见 素 抱 朴 。 
一 一 老子 , 《老子 》 一 公元 前 550 年 

使 用 接口 的 首要 目标 就 是 降低 编程 的 复杂 性 ， 因 此 很 容易 理解 ， 简 单 性 也 是 接口 设计 最 
迫切 的 目标 。 通 常 来 说 ， 一 个 接口 应 该 尽 可 能 降低 使 用 难度 。 虽 然 底层 实现 的 操作 可 能 极度 
错综复杂 ， 但 是 应 该 让 用 户 可 以 从 一 个 更 简单 、 更 抽象 的 角度 去 了 解 这 些 操 作 。 

在 某 种 程度 上 ， 接 口 扮演 着 一 个 特定 库 抽 象 参 考 指南 的 角色 。 当 你 想 要 知道 怎样 使 
H error 函数 的 时 候 ， 你 只 需要 查询 error. h 接口 来 了 解 使 用 方法 。 接 口 包 含 了 你 所 
需要 的 全 部 信息 4 对 于 用 户 来 说 ， 知 道 太 多 和 太 少 的 信息 同样 都 是 不 利 的 ， 因 为 多 余 的 细 
节 信 息 将 使 界面 变 得 更 难以 理解 。 通 常 ， 接 口 所 含 的 数据 信息 应 隐藏 在 接口 中 而 不 应 对 外 
暴露 。 

当 你 设计 一 个 接口 时 ， 你 应 该 尽 可 能 地 使 用 户 远离 其 实现 的 复杂 细节 。 从 这 个 角度 上 
讲 ， 最 好 的 办 法 是 将 接口 设计 成 一 堵 分 隔 用 户 和 实现 的 墙 ， 而 不 是 这 两 个 部 分 间 的 通信 渠道 。 


ES 
mH 
像 希 腊 神话 中 分 隔 皮 拉 莫 斯 和 提 斯 伯 的 墙 一 样 ， 这 堵 墙 在 用 户 和 实现 之 间 提 供 了 一 道 
颖 隙 来 使 双方 进行 沟通 。 在 编程 时 ， 这 一 缝 际 包 含 了 允许 用 户 和 实现 之 间 进 行 沟通 的 界面 人 
口 。 但 是 这 墙 墙 的 主要 目标 是 保持 用 户 和 实现 的 分 离 。 由 于 我 们 总 是 将 它 看 成 代表 库 的 抽象 
的 一 道 边 界 ， 所 以 接口 有 时 也 称 作 抽 象 边界 (abstraction boundary ) 。 理 想 情 况 下 ， 库 中 所 有 
复杂 的 部 分 都 会 被 隔离 在 实现 的 一 边 。 一 个 成 功 的 接口 将 使 用 户 远离 那些 复杂 的 实现 。 保 持 
实现 细节 被 限制 在 库 的 实现 中 又 被 称 为 信息 隐藏 (information hiding). 
信息 隐藏 原理 在 接口 的 设计 上 具有 重要 的 现实 意义 。 当 你 编写 一 个 接口 时 ， 应 该 确保 没 
有 公开 其 实现 的 细节 ， 包 括 注释 部 分 。 特 别 是 当 你 同时 编写 接口 和 实现 程序 的 时 候 ， 你 可 能 
会 忍 不 住 想 要 在 接口 中 介绍 你 在 实现 库 时 用 到 的 巧妙 方法 。 试 着 放弃 这 种 想法 ， 接 口 的 目标 
是 使 用 户 感到 方便 ， 应 该 只 包含 用 户 需 要 知道 的 信息 。 
同样 ， 你 在 接口 中 应 该 尽 可 能 将 函数 设计 得 足够 简单 。 如 果 你 可 以 减少 函数 参数 的 数 
量 , 或 者 有 减少 函数 发 生 特殊 情况 的 方法 ， 都 将 使 函数 变 得 更 加 简单 易 用 。 除 此 之 外 ， 限 制 
一 个 接口 提供 的 函数 数量 也 是 有 利 的 ， 这 样 做 可 以 使 得 用 户 不 会 在 大 量 的 函数 中 迷失 自己 而 
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缺乏 对 整个 接口 的 了 解 。 


2.7.3 满足 用 户 需 求 

每 一 件 事 都 应 尽 可 能 的 简单 ， 但 不 能 过 度 。 

一 一 阿尔 伯 特 . 爱 因 斯 坦 

简单 易 用 只 是 设计 库 要 求 的 一 部 分 。 为 了 使 库 变 得 简单 ， 最 容易 的 做 法 就 是 删除 库 中 复 
杂 和 难 懂 的 部 分 。 但 这 么 做 也 会 使 你 设计 的 库 的 可 用 性 降低 。 有 时 用 户 需 要 执行 一 些 具有 内 
在 复杂 性 的 任务 。 所 以 为 了 接口 的 简单 而 拒绝 用 户 的 需求 不 是 一 个 好 想法 。 为 了 更 好 地 服务 
于 用 户 ， 你 的 库 必 须 提供 充足 的 函数 。 学 会 在 设计 库 的 时 候 平衡 好 简单 性 和 完整 性 是 一 项 重 
要 而 艰巨 的 任务 。 

在 许多 情况 下 ， 接 口 的 用 户 考虑 的 不 只 是 库 是 否 提供 了 某 项 功能 ， 他 们 同时 也 在 考虑 这 
项 功能 的 实现 是 否 是 高 效 的 。 例 如 ， 如 果 你 正在 开发 一 个 空中 交通 管理 系统 ， 并 且 该 系统 需 
要 使 用 库 中 的 函数 ， 你 会 要 求 这 些 函 数 必须 快速 返回 正确 的 数值 。 过 慢 的 应 答 与 错误 的 返回 
值 都 将 酿 成 灾难 性 的 后 果 。 

在 大 多 数 时 候 ， 程 序 执行 效率 更 多 的 与 库 的 实现 有 关 ， 而 与 接口 无 关 。 即 使 这 样 ， 你 也 
会 经 常 发 现在 设计 接口 时 考虑 实现 策略 是 很 有 意义 的 。 假 如 让 你 在 两 种 设计 中 做 出 选择 ， 其 
中 一 种 设计 的 实现 更 加 简单 高 效 ， 而 另 一 种 并 没有 让 你 有 不 得 不 选 的 其 他 原因 ， 那 毫 无 疑问 
你 会 选择 简单 高 效 的 设计 。 


2.7.4 通用 工具 的 优势 
给 我 们 工具 ， 我 们 将 完成 任务 。 





mem: ER, 1941 年 BBC 广播 演讲 

一 个 完全 适合 某 种 特定 类 型 用 户 的 接口 ， 并 不 一 定 适合 其 他 类 型 的 用 户 。 一 个 好 的 库 抽 
象 必须 服务 于 多 种 类 型 用 户 的 需求 。 为 了 达到 此 目的 ， 我们 必须 在 设计 的 时 候 提 高 库 的 通用 
性 ， 以 使 得 它 可 以 解决 多 元 化 的 问题 而 不 是 受 限 于 某 个 非常 特殊 的 应 用 情况 。 为 了 选择 一 种 
灵活 性 强 的 设计 ， 你 可 以 创建 多 用 途 的 接口 。 

确保 接口 的 通用 性 具有 重要 的 现实 意义 。 当 你 编写 一 个 程序 时 ， 会 经 常 发 现 你 需要 一 个 
特殊 的 工具 。 如 果 你 认为 这 个 工具 非常 重要 以 至 于 需要 把 它 放 入 到 库 中 ， 那 么 你 就 需要 转换 
你 的 思维 模式 了 。 当 你 为 那个 库 设计 接口 的 时 候 ， 你 必须 遗忘 这 个 库 最 初 的 应 用 环境 ， 而 应 
为 更 通用 的 受众 设计 你 的 接口 。 


2.7.5 ” 库 稳 定性 的 价值 

人 们 改变 了 ， 却 忘 了 彼此 告知 。 太 糟 粒 了 一 一 这 导致 了 许多 错误 。 

一 一 莉莉 安 ， 海尔 曼 ,《 阁楼 里 的 玩具 》，1959 

接口 的 另 一 特性 使 得 它们 在 编程 中 具有 关键 的 作用 : 它们 可 以 在 很 长 一 段 时 间 中 保持 自 
身 的 稳定 。 一 个 稳定 的 接口 通过 创建 清晰 的 责任 边界 可 以 大 大 简化 系统 的 维护 。 在 库 接口 不 
变 的 情况 下 ， 实 现 者 和 用 户 都 可 以 相对 自由 地 改变 自身 负责 部 分 的 代码 。 

例如 ， 想 象 一 下 你 是 <cmath> 库 的 实现 者 。 在 你 工作 的 时 候 ， 发 现 了 一 个 实现 sqrt 
函数 的 更 精妙 方法 ， 这 个 方法 可 以 使 得 计算 平方 根 的 时 间 缩 小 到 一 半 。 如 果 可 以 向 用 户 告 知 
你 有 一 个 sqrt 函数 的 更 好 的 实现 方法 ， 这 个 方法 比 以 往 更 快 ， 他 们 会 非常 高 兴 。 但 从 另 一 
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方面 来 说 ， 如 果 你 告诉 用 户 函 数 的 名 称 将 改变 或 者 说 函数 具有 新 的 约束 ， 那 么 用 户 会 感到 慰 
怒 。 为 了 使 用 你 提供 的 “改进 版 ”平方 根 函 数 ， 他 们 需要 被 迫 修 改 自己 的 程序 。 修 改 程序 是 
一 项 耗费 时 间 ， 易 于 出 错 的 活动 ， 很 多 用 户 宁愿 放弃 程序 的 一 部 分 性 能 提升 ， 也 不 愿意 他 们 
的 程序 经 修改 后 而 无 法 运行 。 

接口 只 有 在 保持 稳定 的 情况 下 才 可 简化 程序 的 维护 。 当 出 现 新 算法 或 者 应 用 需求 变化 
时 ， 程 序 经 常 被 修改 。 然 而 在 程序 的 这 种 进化 中 ， 其 接口 应 尽 可 能 地 保持 不 变 。 在 一 个 良好 
设计 的 系统 中 ， 修 改 实现 是 一 个 直截了当 的 过 程 。 修 改 所 涉及 的 复杂 性 只 限定 于 抽象 边界 的 
实现 部 分 。 另 外 ， 修 改 接口 通常 会 导致 依赖 于 该 接口 的 所 有 程序 都 必须 进行 修改 。 因 此 ， 修 
改 接口 应 是 非常 罕见 的 行为 ， 这 一 行为 应 仅 在 用 户 参 与 时 进行 。 

某 些 接口 的 修改 造成 的 影响 将 会 比 其 他 接口 的 修改 造成 的 影响 更 大 。 例 如 ， 在 库 中 添 
加 一 个 全 新 的 函数 是 一 个 直截了当 的 工作 ， 因 为 并 没有 用 户 的 程序 使 用 过 这 个 函数 。 像 这 样 
接口 修改 使 得 以 前 使 用 该 库 的 程序 不 用 进行 修改 的 行为 称 为 接口 的 扩展 〈extending)。 如 果 
你 发 现在 一 个 接口 的 生命 周期 中 需要 对 接口 进行 一 次 升级 ， 最 好 的 办 法 是 通过 扩展 来 达到 此 
目的 。 


2.8 随机 数 库 的 设计 


领会 接口 设计 原则 最 容易 的 方法 就 是 进行 一 次 简单 的 设计 实践 。 为 达到 此 目的 ， 本 节 
将 讲述 开发 Stanford 类 库 中 random. hn 接口 的 整个 设计 过 程 ， 它 便 编写 做 出 似 随 机 选择 的 
程序 成 为 可 能 。 模 拟 随 机 过 程 是 必须 的 ， 例 如 ， 如 果 你 想 要 编写 抛 硬币 或 者 掷 货 子 的 电脑 游 
戏 ， 你 就 需要 模拟 随机 过 程 ， 当 然 ， 这 一 过 程 在 实际 应 用 中 还 有 着 更 重要 的 作用 。 模 拟 随 机 
事件 的 程序 称 作 不 确定 性 的 (nondeterministic ) 程序 。 

让 计算 机 表现 出 随机 选择 的 行为 是 比较 复杂 的 。 为 了 给 用 户 程序 提供 便利 ， 你 必须 隐藏 
接口 背后 的 复杂 过 程 。 本 节 你 将 有 机 会 从 接口 设计 者 、 接 口 实现 者 和 用 户 这 几 个 不 同 的 角度 
来 了 解 这 个 接口 。 


2.8.1 随机 数 与 伪 随 机 数 


使 用 计算 机 生成 随机 过 程 的 概念 经 常 被 描述 为 生成 特定 范围 内 的 一 个 随机 数 ( random 
number)， 部 分 原因 是 早期 计算 机 主要 用 于 处 理 数值 应 用 。 从 理论 上 讲 ， 一 个 无 法 预测 其 值 ， 
且 在 其 取 值 范围 内 其 值 等 概率 出 现 的 数 被 称 为 随机 数 。 例 如 ， 掷 仍 子 时 出 现 一 个 范围 从 1 到 6 
的 随机 数 。 如 果 货 子 是 正常 的 ， 我 们 将 无 法 准确 预测 掷 出 的 数字 。 并 且 六 个 值 出 现 的 概率 均等 。 

虽然 随机 数 的 概念 看 起 来 如 此 直观 ， 但 是 要 将 这 一 概念 在 计算 机 上 实现 是 有 困难 的 。 因 
为 计算 机 总 是 执行 内 存 中 一 系列 特定 序列 的 指令 ， 因 此 计算 机 的 函数 都 是 遵循 确定 的 模式 
的 。 怎 么 让 遵循 确定 序列 指令 的 计算 机 产生 不 可 预测 的 结果 呢 ? 如 果 一 个 数 是 一 个 确定 过 程 
的 结果 ， 那么， 任何 用 户 都 应 该 能 通过 一 组 相同 的 指令 来 预测 出 计算 机 的 响应 。 

事实 上 ， 计 算 机 正 是 通过 使 用 特定 的 过 程 来 产生 所 谓 的 随机 数 。 这 一 策略 之 所 以 可 行 ， 
是 因为 理论 上 用 户 可 以 通过 同样 的 一 组 指令 预测 出 计算 机 的 结果 ， 但 实际 上 并 没有 人 会 无 聊 
到 去 做 这 种 事 。 在 大 多 数 现实 应 用 中 , 产生 的 数字 是 否 真 正 是 随机 的 关系 并 不 大 ， 真 正 有 影 
响 的 是 该 数字 看 起 来 是 不 是 随机 的 。 为 了 使 产生 的 数字 看 起 来 是 随机 的 ， 它 们 必须 具备 如 下 
特点 : (1) 从 统计 的 观点 来 看 ， 该 数 表现 的 像 一 个 随机 数 ; ( 2 ) 事先 要 预测 这 个 数 的 值 应 该 
很 难 ， 以 至 于 没有 人 想 去 预测 它 。 通 过 计算 机 中 的 一 个 特定 算法 来 产生 的 “随机 数 ” 也 被 称 
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作伪 随机 数 ( pseudorandom number)， 这 一 名 称 也 强调 了 在 该 数 的 产生 过 程 中 并 不 涉及 真正 
的 随机 活动 。 


2.8.2 ”标准 库 中 的 伪 随 机 数 


<cstdlib> 类 库 提 供 了 一 个 低级 的 函数 rand， 调 用 该 函数 可 以 产生 伪 随 机 数 ，rand 
函数 的 函数 原型 为 : 


int rand(); 


此 函数 原型 表明 rand 函数 无 须 传人 参数 ， 并 且 函 数 返回 一 个 整 型 值 。 每 一 次 对 rand 的 调 
用 将 产生 一 个 让 用 户 难 以 预测 其 值 的 不 同 的 随机 数 。rana 函数 的 结果 是 一 个 大 于 等 于 零 且 
小 于 等 于 常量 RAND MAX 的 整数 ， 而 RAND MAX 被 定义 在 <cstdlib> 中 。 因 此 ， 每 一 次 
调用 rand 函数 ， 这 个 函数 将 返回 从 0 到 RAND MAX 之 间 的 任意 一 个 整数 。 

如 果 你 想 要 更 深刻 地 体会 rand 函数 的 工作 过 程 ， 一 个 方法 就 是 编写 一 个 简单 的 程序 来 
测试 它 。 图 2-10 的 RandTest 程序 显示 了 RAND MAX 的 值 ， 然 后 打印 出 10 次 调用 rand 
函数 的 结果 。 程 序 运行 的 实例 如 下 : 
















r, RAND 
The first 10 calls to rand: 
1103527590 

377401575 
| 662824084 
1147902781 
| 2035015474 
: 368800899 
|1508029952 
| 486256185 
1062517886 
, 267834847 


is 2147483647 
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/* 
* File: RandTest.cpp 


* This program tests the random number generator in C++ and produces 
* the values used in the examples in the text 


i 


#include <iostream> 
#include <iomanip> 
#include <cstdlib> 
using namespace std; 


const int N_TRIALS = 10; 


int main() ( 
cout «« "On this computer, RAND MAX is " «« RAND MAX «« endl; 
cout << "The first " << N TRIALS << " calls to rand:" << endl; 
for (int i = 0; i < N TRIALS; i++) { 
cout << setw(10) << rand() << endl; 
} 


return 0; 


图 2-10 测试 rand 函数 的 程序 


正如 你 所 看 到 的 ，rangd 函数 的 值 总 是 正 的 ， 并且 从 来 不 会 大 于 RAND MAX UB. rf EL, PR 
数 的 值 看 起 来 在 规定 数字 范围 内 不 停 变 动 ， 无 法 预测 ， 这 也 正 是 你 想 要 从 一 个 伪 随 机 过 程 得 
到 的 结果 。 
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假设 C++ 类 库 中 已 存在 一 个 产生 伪 随 机 数 的 函数 ， 你 可 能 有 充足 的 理由 想 问 为 什么 我 
们 要 重新 设计 一 个 接口 来 支持 这 一 过 程 。 一 部 分 的 答案 是 rand 函数 本 身 并 不 总 是 返回 用 户 
原意 所 需要 的 数值 。 另 一 方面 ，RAND_MRX 的 值 取决 于 硬件 和 软件 环境 。 在 大 多 数 系 统 上 ， 
RAND MAX 被 定义 为 整 型 数 的 最 大 值 ， 通 常 为 2 147 483 647， 但 在 不 同 的 系统 上 这 一 数值 
可 能 不 一 样 。 即 使 你 能 确定 RAND MAX 拥有 特定 的 值 ， 也 只 有 少 部 分 应 用 情况 会 需要 一 个 
在 0 到 2 147 483 647 之 间 的 值 。 作 为 一 个 用 户 ， 你 更 想 要 的 是 一 个 落 在 另 一 个 数值 范围 内 
的 随机 数 ， 通 常 这 一 范围 会 比 上 面 列举 的 范围 要 小 。 例 如 ， 如 果 你 想 要 模拟 抛 硬币 的 过 程 ， 
你 仅 需 要 有 两 种 输出 可 能 性 的 函数 : 正面 和 反面 。 同 样 ， 如 果 你 想 要 表示 一 个 掷 仍 子 的 过 
程 ， 你 需要 在 1 到 6 中 产生 一 个 随机 整数 。 如 果 你 正在 尝试 模拟 物理 世界 ， 你 需要 一 个 在 连 
续 范 围 内 的 随机 数 ， 这 个 数 需 用 double 类 型 来 表示 ， 而 不 是 int 类 型 。 如 果 你 可 以 设计 
一 个 符合 以 上 用 户 需求 的 接口 ， 那 么 这 个 接口 会 更 加 灵活 ， 使 用 起 来 也 会 更 加 简便 。 

设计 一 个 更 高 层次 接口 的 另 一 个 原因 是 : 使 用 <cstdlib> 中 的 低层 次 接口 会 使 你 在 实 
现 的 过 程 中 提高 程序 的 复杂 性 ， 而 这 些 复杂 性 正 是 用 户 所 极力 避免 的 。 接 口 设计 师 的 一 部 分 
工作 就 是 要 最 大 化 地 向 用 户 隐藏 这 些 复杂 的 实现 过 程 。 定 义 一 个 高 层次 的 random.h 接口 
使 得 这 一 设想 成 为 可 能 ， 因 为 这 一 接口 可 以 使 得 复杂 性 局 限于 实现 过 程 中 。 


2.8.3 选择 正确 的 函数 集 


作为 一 个 接口 设计 者 ， 你 面临 的 首要 挑战 就 是 选择 接口 对 外 提供 的 函数 。 虽 然 接口 设计 
看 起 来 更 偏向 于 艺术 方面 而 不 是 科学 方面 ， 但 依然 有 2.7 节 中 所 包含 的 若干 通用 原则 可 供 设 
计 中 遵循 。 特 别 是 ， 你 在 random.h 中 提供 的 函数 必须 足够 简单 ， 并 且 应 尽 可 能 隐藏 其 背 
后 复杂 的 实现 过 程 。 同 时 ， 这 些 函 数 还 必须 提供 必要 的 关键 功能 来 满足 用 户 的 广泛 需求 ， 这 
也 意味 着 你 必须 清楚 了 解 用 户 有 怎样 的 需求 。 理 解 这 些 需 求 的 能 力 不 仅 取决 于 你 自己 的 设计 
经 验 ， 也 通常 需要 与 潜在 用 户 进 行 交 流 以 更 好 地 理解 这 些 需求 。 
以 我 本 人 的 编程 经 验 ， 我 知道 用 户 期 望 从 random.h 中 获得 以 下 功能 : 
e 从 一 个 特定 的 区 域内 选取 一 个 随机 整数 。 例 如 ， 如 果 你 想 要 模拟 掷 一 个 具有 六 个 面 
的 标准 角子 的 过 程 ， 你 需要 从 1 到 6 中 随机 选择 一 个 整数 。 
e 从 一 个 特定 的 区 域内 选取 一 个 随机 实数 。 如 果 你 想 要 一 个 物体 处 于 空间 中 的 一 个 随 
机 位 置 ， 你 需要 在 所 有 限制 条 件 中 随机 生成 坐标 x RI y 值 。 
e 以 某 个 特定 概率 模拟 一 个 随机 事件 。 如 果 你 想 要 模拟 抛 硬币 这 一 事件 ， 你 需要 生成 具 
有 概率 为 0.5 的 heads 值 ， 这 也 意味 着 在 抛 硬币 时 ， 有 5096 的 概率 硬币 的 正面 朝 上 。 
将 这 些 概念 上 的 操作 转换 为 一 组 函数 原型 是 一 个 相对 直接 的 工作 。random.h 中 的 三 个 函数 
(randomInteger, randomReal, randomChance) 对 应 了 这 三 个 操作 。 一 个 完整 的 接口 ， 还 
包括 了 男 一 个 函数 ， 称 为 setRandomSeed， 这 一 函数 出 现在 图 2-11 中 ， 其 功能 将 在 稍 后 介绍 。 


/* 


* File: random.h 
* 


* This file exports functions for generating pseudorandom numbers. 


irá 
#ifndef random h 
#define random h 
/* 


* Function: randomInteger 





图 2-11 随机 数 库 接 口 
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* Usage: int n 


* Returns a random ínteger in the range low to high, inclusive 


*/ 
int randomInteger(int low, int high); 
/* 


Function: randomReal 
Usage: double d - randomReal(low, high); 


Returns a random real number in the half-open interval [low, high). A 
half-open interval includes the first endpoint but not the second, which 
means that the result is always greater than or equal to low but 
strictly less than high. 

/ 


double randomReal(double low, double high); 


Function: randomChance 
Usage: if (randomChance (p)) 


Returns true with the probability indicated by p. The arqument p must 
be a floating-point number between 0 (never) and 1 (always) For 
example, calling randomChance(.30) returns true 30 percent of the time. 


bool randomChance (double p); 


/* 
* Function: setRandomSeed 
* Usage: setRandomSeed (seed); 
* 
Sets the internal random number seed to the specified value You can 
use this function to set a specific starting point for the pseudorandom 
sequence or to ensure that program behavior is repeatable during the 
debugging phase. 
/ 


void setRandomSeed(int seed); 
#endif 





图 2-11 ( 续 ) 


正如 你 在 图 2-11 中 的 注释 和 原型 中 所 看 到 的 ，randomInteger 因数 需要 传人 两 个 整 
型 参数 并 返回 一 个 在 这 两 个 数 范围 内 的 随机 整数 。 如 果 你 想 要 模拟 毛 骨 子 的 过 程 ， 只 要 像 下 
面 这 样 调用 函数 即 可 : 


randomInteger(1, 6) 


为 了 模拟 一 个 欧洲 大 转盘 (美国 转盘 除了 1 到 36 之 外 ,还 有 0 和 00 这 两 个 位 置 )， 你 应 该 
这 样 调用 函数 : 

randomInteger(0, 36) 

randomReal 函数 理论 上 来 说 与 randomInteger KA EXM. (Aix + RR BE 
人 两 个 浮 点 参数 : low 和 high， 并 且 返 回 一 个 浮 点 数 上 =， 且 满足 : low<r<high. fli, 
调用 randomReal (0, 1) 将 返回 一 个 不 小 于 0 但 小 于 !1 的 浮 点 数 。 数 学 上 ， 可 等 于 某 一 端 
点 的 值 而 不 能 等 于 另 一 端点 的 值 的 一 个 实数 区 间 称 为 半 开 区 间 ( half-open-intrerval) 。 在 一 
条 数 轴 上 ， 一 个 半 开 区 间 用 一 个 空心 点 来 标记 其 值 不 能 等 于 端点 值 ， 例 如 : < 


0 工 
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在 数学 上 ， 依 照 惯 例 是 使 用 方 括号 来 表示 区 间 闭 端 ， 使 用 圆 括号 来 表示 区 间 的 开端 ， 所 
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以 [0, 1) 表示 了 图 中 所 示 的 半 开 区 间 。 
函数 randomChance 被 用 来 模拟 具有 特定 概率 的 随机 事件 ， 并 且 其 事件 发 生 概 率 可 以 
设 定 。 按 照 惯例 ， 事 件 发 生 概率 通过 0 到 1 中 的 一 个 数值 来 表示 : 0 表示 不 可 能 事件 , .1 表 
示 必 然 事件 。 像 这 样 randomChance (p) 调用 函数 将 以 p 为 概率 返回 true 值 。 因此， 以 
randomChance (0.75) 调用 函数 将 有 大 约 75% 的 概率 返回 true (A. 
你 可 以 使 用 randomChance 函数 来 模拟 抛 硬币 的 结果 ， 正 如 以 下 函数 说 明 的 ， 函 数 以 
等 概率 返回 “heads” 或 “tails”: 
string flipCoin() { 
if (randomChance(0.50)) { 
return "heads"; 
} else { 
return "tails"; 


} 
} 


2.8.4 构建 用 户 程 序 


验证 接口 设计 的 最 好 方法 就 是 编写 一 个 程序 并 使 用 它 。 图 2-12 所 示 的 程序 给 出 了 使 用 
函数 来 模拟 一 种 称 为 craps 的 赌场 游戏 。craps 的 规则 在 程序 开头 的 注释 
中 进行 了 介绍 ， 你 也 可 以 让 程序 向 玩家 介绍 这 一 规则 。 在 这 个 例子 中 ， 为 了 节省 空间 我 们 省 
cesta ty 步骤 。 

尽管 craps .cpp 程序 是 不 确定 性 的 ， 并 且 每 次 会 产生 不 同 的 输出 ， 运 行 该 程序 一 个 可 
能 的 实例 如 下 : 





2.8.5 ”随机 数 库 的 实现 


直到 现在 ， 这 一 章 看 起 来 依旧 停留 在 设计 random.h 接口 这 一 步骤 上 。 当 你 能 在 程序 
中 实际 使 用 这 一 接口 之 前 ， 编 写 random. cpp 来 实现 库 显 得 尤为 重要 。 在 这 一 阶段 你 需 
要 知道 在 «cstalib» 库 中 存在 一 个 可 以 产生 从 0 到 RAND. MAX 随机 数 的 函数 rand, iX 
一 数值 范围 如 下 图 所 示 : 


离散 数值 : 
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为 了 达到 这 一 目的 ， 出 现 了 很 多 并 不 高 明 的 转换 方法 。 很 多 书 会 采用 以 下 方法 : 


int die = rand() $ 6 + 1; 


~ 
+ + + 


This program plays the casino game called craps, which is 
played using a pair of dice. At the beginning of the game, 
you roll the dice and compute the total. If your first roll 
is 7 or 11, you win with what gamblers call a "natural." 

If your first roll is 2, 3, or 12, you lose by "crapping 
out." In any other case, the total from the first roll 
becomes your "point," after which you continue to roll 

the dice until one of the following conditions occurs: 


a) You roll your point again, in which case you win. 
b) You roll a 7, in which case you lose. 


Other rolls, including 2, 3, 11, and 12, have no effect 
during this phase of the game. 


*o* X 0X 0X 9 X* et tHe ee He 下 


* 
Pas 


#include <iostream> 
#include "random.h" 
using namespace std; 


/* Function prototypes */ 


bool tryToMakePoint (int point); 
int rollTwoDice(); 


/* Main program */ 


int main() ( 
cout «« "This program plays a game of craps." «« endl; 
int point - rollTwoDice(); 
switch (point) { 
case 7: case 11: 
cout «« "That's a natural. You win." «« endl; 
break; 
case 2: case 3: case 12: 
cout «« "That's craps. You lose." «« endl; 
break; . 
default: 
cout «« "Your point is " «« point «« "." «« endl; 
if (tryToMakePoint(point)) { 
cout «« "You made your point. You win." «« endl; 
) eise ( 
cout «« "You rolled a seven. You lose." «« endl; 
) 
) 
return 0; 
[97 | ) 
/* 
* Function: tryToMakePoint 
* Usage: flag = tryToMakePoint (point); 


Rolls the dice repeatedly until you either make your point or roll a 7. 
The function returns true if you make your point and false if a 7 comes 
up first. 

wif 


bool tryToMakePoint (int point) { 
while (true) { 
int total = rollTwoDice(); 
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if (total == point) return true; 
if (total == 7) return false; 


} 


) 
/* 


* Function: rollTwoDice 
* Usage: total - rollTwoDice(); 
* 


* Simulates the process of rolling two dice. The individual values of the 
* dice are printed on cout along with the sum, which is returned as the 
* value of the function. 


wf 


int rollTwoDice() { 

cout << "Rolling the dice . . ." << endl; 

int dl = randomInteger(1, 6); 

int d2 = randomInteger(1, 6); 

int total = dl + d2; 

cout << "You rolled " << dl << " and " << d2 
<< " = that's " << total << "." << endl; 

return total; 





图 2-12 (48) 


这 一 句 代码 表面 上 看 起 来 简单 易 懂 。rand 函数 总 是 返回 一 个 正 整数 ， 这 个 数 除 6 的 余数 必 
然 会 落 在 0 到 5 之 间 ， 将 所 得 余数 加 1 使 最 终 数 值 落 在 我 们 所 需要 的 区 域 1 到 6 的 数值 中 。 

问题 的 关键 是 rana 函数 只 保证 生成 的 值 可 以 一 致 均匀 地 分 布 在 0 到 RAND MAX 之 间 。 
也 就 是 说 ， 这 个 函数 并 不 能 保证 结果 除 6 之 后 得 到 的 余数 都 具备 同样 的 随机 性 。 事 实 上 ， 早 
期 随 UNIX 操作 系统 一 起 发 布 的 rand 函数 版 本 产生 的 值 在 奇数 和 偶数 中 间 选 择 ， 而 不 管 实 
际 上 这 些 数字 在 其 取 值 范围 内 出 现 的 概率 是 否 相 同 。 获 取 除 6 的 余数 也 将 在 奇数 和 偶数 之 间 
做 选择 ， 这 将 使 得 结果 很 难 符合 随机 数 的 定义 。 如 果 没 有 别 的 办 法 ,我们 无 法 连续 两 次 随机 
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你 所 要 做 的 就 是 去 除 以 0 到 RRAND_MRAX 之 间 的 整数 ， 使 得 结果 落 在 六 个 长 度 相 等 的 区 
域 来 得 到 不 同 的 输出 ， 就 像 下 图 所 示 : 
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更 通用 的 情况 是 ， 你 首先 需要 将 0 到 RAND MAX 的 数 轴 划 分 成 k 个 相等 的 区 间 ， 这 k 个 区 
间 代 表 了 你 想 要 的 输出 值 范围 。 然 后 ， 你 所 需要 做 的 就 是 将 每 个 区 间 数 映射 为 用 户 所 需要 
的 值 。 

将 rand 函数 返回 结果 转换 为 有 限 区 域内 的 一 个 整数 这 一 过 程 可 以 简单 地 看 成 由 以 下 四 
个 步骤 组 成 : 

1. 规范化 (normalize) rand 函数 的 整数 结果 ad， 将 其 转换 为 浮 点 数 ， 且 满足 : 
0<d<1,. 

2. $4% (scale) d 值 ,将 d 乘 以 想 要 的 数值 范围 来 实现 ， 使 得 数值 d 为 落 入 到 其 数据 范 
围 内 的 一 个 正确 的 整数 。 

3. 翻译 (translate) d 值 ， 将 d 加 上 最 低 边 界 值 使 其 数值 范围 从 预想 的 点 开始 。 

4. 转换 (convert) d 值 , 调用 <cmath> 类 库 中 的 floor 函数 将 d 转换 为 小 于 其 函数 参 
数 的 最 大 整数 。 
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图 2-13 说 明了 上 述 步 又 ,并且 通 过 该 过 程 可 跟踪 到 一 条 可 能 的 路 径 。 如 果 rand 函数 的 调 
用 返回 了 数值 848 256 064, JfH RAND MAX 的 最 常见 值 是 2 147 483 647， 则 规范 化 阶段 将 
产生 一 个 靠近 0.4 的 值 (图 2-13 中 的 值 为 了 使 取 值 符合 图 表 已 经 将 数值 取 为 保留 一 位 小 数 )。 
在 量化 阶段 将 此 数值 乘 以 6 得 到 2.4， 之 后 的 翻译 阶段 增加 到 3.4。 在 转换 阶段 ， 以 3.4 为 输 
AEI foor 函数 ， 则 程序 输出 数值 3。 

编写 代码 来 实现 上 述 过 程 并 不 如 想象 中 的 容易 ， 因 为 在 上 述 过 程 中 还 存在 一 些 可 能 不 够 
完美 的 程序 的 失败 陷阱 。 例 如 仅 考 虑 规范 化 阶段 ， 你 不 能 通过 如 下 调用 将 rand 函数 处 在 区 
间 [0, 1) 中 的 返回 值 转换 为 浮 点 型 数值 : 


double d = double(rand()) / RAND MAX; M 


初次 调用 rand 函 数 
0 848256064 RAND MAX 








图 2-13 生成 1 一 6 区 域 的 一 个 随机 数 所 需 的 步骤 


这 里 的 主要 问题 是 rand 函数 可 能 返回 一 个 RAND Max 值 ， 这 意味 着 变量 a 会 被 赋值 为 
1.0， 而 这 一 数值 并 不 在 半 开 区 间 内 。 你 也 不 能 像 下 面 这 样 编写 代码 : 


double d = double(rand()) / (RAND MAX * 1); LA 


虽然 这 里 存在 的 问题 更 加 微妙 。 像 我 们 之 前 所 说 的 ，RAND_MAX 是 int 类 型 的 最 大 正 整 数 
值 。 如 果 碰 到 这 种 情况 ,将 RAND MAX 加 1 将 会 得 到 一 个 上 溢 的 数值 。 

为 了 解决 上 述 问题 ， 你 需要 做 的 就 是 使 用 double 类 型 数值 而 不 是 int 类 型 数值 ， 像 
下 面 这 样 : 

double d = rand() / (double(RAND MAX) + 1); 

在 量化 阶段 你 会 遇 到 类 似 的 问题 。 数 学 上 在 low 到 high 范围 内 的 整数 个 数 通过 如 下 


表达 式 计算 获得 : high-low+1。 然 而 ， 如 果 high 是 一 个 大 的 正 数 而 low 是 一 个 小 的 负 
数 。 那 么 ， 这 一 表达 式 也 必须 使 用 双 精 度 浮 点 数 来 表示 。 
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考虑 到 上 述 所 有 实现 的 复杂 性 ，randomInteger 函数 的 实现 过 程 如 下 : 


int randomInteger(int low, int high) { 
double d = rand() / (double(RAND MAX) + 1); 
double s = d * (double(high) - low + 1); 
return int(floor(low + s)); 


) 
在 你 解决 randomInteger 函数 实现 的 复杂 性 之 后 ，randomReal fll randomChance fA 
数 的 实现 过 程 相 对 比较 简单 了 : 
double. randomReal(double low, double high) ( 
double d = rand() / (double(RAND MAX) + 1); 
double s = d * (high - low); 


return low + s; 


) 


bool randomChance (double p) { 
return randomReal(0, 1) « p; 
) 


2.8.6 初始 化 随机 数 种 子 


遗憾 的 是 ， 前 面 介 绍 的 randomInteger、randomReal fll randomChance phi MIF 
不 会 像 用 户 希 望 的 那样 工作 。 问 题 在 于 : 与 产生 无 法 预测 的 结果 相反 ， 使 用 这 些 函 数 的 程序 
总 会 产生 相同 的 结果 。 举 例 来 说 ， 如 果 你 运行 Craps 程序 20 次 ， 每 次 你 都 会 看 到 程序 产生 
完全 相同 的 输出 。 并 不 产生 随机 数 。 

为 了 弄 明 白 为 何 函数 的 实现 会 产生 这 一 结果 ， 你 可 以 回 到 函数 RandTest 程序 并 再 一 
次 运行 该 程序 。 此 时 ， 程 序 输出 为 : 





computer, RAND MAX is 21 

The first 10 calls to rand: 
1103527590 
| 377401575 
| 662824084 
| 1147902781 

2035015474 

368800899 

1508029952 

486256185 

1062517886 

267834847 
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这 次 程序 的 运行 输出 与 第 一 次 运行 输出 的 结果 相同 。 事 实 上 ，RandTest 程序 每 次 都 会 产生 
完全 相同 的 输出 ， 因 为 C++ 类 库 (该 类 库 的 基础 也 就 是 早期 的 C 语 言 库 ) 的 设计 者 设计 的 
rand 函数 每 次 运行 都 会 产生 相同 的 随机 序列 。 

首先 ， 你 可 能 很 难 理解 产生 随机 数 的 函数 为 什么 会 总 是 返回 同一 序列 的 值 。 毕 竟 这 种 
确定 的 行为 似乎 与 随机 概念 完全 相反 。 然 而 ， 程 序 的 这 一 行为 很 好 解释 : 一 个 具有 确定 行为 
的 程序 更 易于 调试 。 

为 了 搞 懂 这 种 重复 到 底 有 什么 意义 ， 想 象 一 下 你 编写 了 一 个 程序 用 来 玩 类 似 大 富翁 这 种 
复杂 的 游戏 。 在 编写 一 个 新 程序 的 时 候 ， 你 的 程序 很 大 程度 上 会 存在 着 一 些 漏洞 。 在 一 个 复 
杂 的 程序 中 ， 漏 洞 常常 会 隐藏 其 中 ， 除 非 现 实 中 某 种 特殊 情况 触发 了 这 一 漏洞 。 假 设 你 在 玩 
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游戏 时 发 现 了 游戏 程序 表现 异常 。 这 时 你 需要 调试 该 程序 ， 如 果 你 可 以 重新 恢复 程序 表现 异 
常 的 状态 并 观察 发 生 了 什么 ， 将 会 使 调试 变 得 非常 方便 。 遗 憾 的 是 ， 如 果 程 序 处 于 一 种 随机 
状态 ,程序 的 第 二 次 运行 与 第 一 次 运行 将 会 产生 不 同 的 表现 。 你 第 一 次 运行 时 出 现 的 漏洞 可 
能 就 不 会 在 第 二 次 运行 时 出 现 。 因 此 ， 最 初 的 C 语言 库 设计 者 进行 了 总 结 ， 认 为 rand 函数 
必须 以 一 个 固定 的 方式 运行 来 支持 程序 的 调试 。 

与 此 同时 ，rang 函数 又 必须 具备 输出 互 不 相同 结果 的 功能 。 为 了 理解 如 何 实现 这 一 行 
为 ， 我 们 必须 了 解 rana 函数 内 部 的 工作 原理 。rand 函数 通过 对 它 最 后 产生 的 值 进行 一 系 
列 数学 计算 来 产生 一 个 新 的 随机 数值 。 因 为 你 不 了 解 这 一 系列 计算 过 程 ， 因 此 将 上 述 整个 操 
作 看 成 一 个 黑箱 操作 会 更 好 ， 其 中 数据 从 黑箱 的 一 端 输入 ， 新 的 伪 随 机 数 将 从 黑箱 的 另 一 端 
输出 。 因 为 第 一 次 调用 rana 函数 产生 值 1 103 527 590， 第 二 次 调用 rand 函数 将 对 应 从 黑 
箱 的 一 端 输入 1 103 527 590， 并 在 其 另 一 端 产生 数 377 401 575: 


1103527590 a. 377401575 


下 一 次 调用 rand 函数 时 ， 实 现 过 程 将 377 401 575 输入 到 黑箱 中 ， 并 返回 662 824 084: 


377401575 一 区- 一 662824084 


每 一 次 调用 rand 函数 将 重复 上 述 相同 过 程 。 黑 箱 内 部 的 计算 过 程 被 设计 为 具有 如 下 功能 : 
C1) 产生 的 随机 数 将 均匀 地 分 布 在 其 合法 的 取 值 区 域内 ; 
(2) 产生 的 随机 数 序列 会 在 很 长 一 段 时 间 后 才 会 重复 出 现 。 
但 为 何在 第 一 次 调用 rand 函数 的 时 候 会 返回 1 103 527 590 We? 因为 要 实现 rand 
函数 的 计算 过 程 ， 必 须 拥 有 一 个 开始 点 。 必 须 存在 一 个 整数 50 被 输入 到 黑箱 中 ， 并 产生 


fË 1 103 527 590; 
Sy — Ey. 1103527590 


这 个 初始 值 一 一 即 用 于 启动 整个 黑箱 过 程 的 值 被 称 为 随机 数 产 生 器 的 种 子 (seed)。 在 
<cstdlib> 类 库 中 ， 你 可 以 通过 调用 srand (seed) 明确 设置 该 种 子 值 。 

正如 在 多 次 运行 RandTest 程序 时 你 所 看 到 的 ，C++ 类 库 在 每 次 程序 启动 时 都 初始 化 
种 子 为 一 个 常量 值 ， 这 就 是 rand 函数 总 是 输出 相同 序列 随机 数 的 原因 。 然 而 这 一 行为 仅 在 
调试 阶段 会 非常 有 用 。 很 多 现代 程序 设计 语言 都 改变 了 默认 值 行为 ， 以 便 随 机 数 库 中 的 函数 
每 次 运行 时 都 返回 不 同 的 值 ， 除 非 程序 员 进 行 了 特殊 设置 。 为 了 用 户 使 用 rana 函数 更 加 简 
单 ， 其 设计 修改 已 体现 在 random.h 接口 中 。 但 是 允许 用 户 能 产生 重复 的 随机 数 序列 值 仍 
然 是 必需 的 ， 因 为 这 样 做 简化 了 调试 程序 过 程 。 对 这 一 选择 的 需求 也 是 我 们 在 random.h 
接口 中 提供 setRandomSeed 函数 的 原因 。 在 调试 阶段 ， 你 可 以 在 main 函数 的 开头 增加 
以 下 语句 : 

setRandomSeed (1) ; 
之 后 ， 对 random. h 接口 函数 的 调用 将 产生 重复 的 以 1 为 初始 种 子 的 随机 数 序列 。 当 确保 
程序 可 正常 运行 后 ， 你 可 以 删除 这 一 语句 以 恢复 程序 产生 不 可 预测 的 结果 。 

为 了 实现 程序 产生 不 可 预测 的 结果 ， 函 数 randomInteger、randomReal 和 
randomChance 必须 在 运行 之 前 首先 检查 随机 数 种 子 是 否 已 经 被 初始 化 ， 如 果 没 有 ， 将 其 
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初始 值 设 为 某 个 用 户 难以 预测 的 值 ， 它 通常 从 用 户 的 系统 时 间 获 得 。 因 为 系统 时 间 数 值 每 一 
次 运行 程序 时 都 不 一 样 ， 随 机 数 序列 也 随 着 时 间 不 断 变化 。 在 C++ 中 ， 你 可 以 通过 调用 函 
数 time 来 获取 系统 时 间 ， 并 将 其 转换 为 一 个 整 型 数 。 这 一 技术 允许 你 编写 如 下 语句 以 使 伪 
随机 数 产 生 器 被 初始 化 为 某 个 不 可 预测 的 值 : 

srand(int(time(NULL))); 

尽管 只 需要 上 述 一 行 代码 ， 但 利用 系统 时 间 将 随机 数 种 子 初始 化 为 一 个 不 可 预知 的 值 这 
一 操作 还 是 相当 隐 汲 难 懂 的 。 如 果 这 一 行 语 句 出 现在 用 户 编写 的 代码 中 ,用 户 就 必须 同时 了 
解 随 机 数 种 子 的 概念 , srand 函数 、time PARA NULL 常数 (这 一 参数 将 在 第 11 章 中 学 习 ) 
这 些 知 识 。 为 了 使 用 户 使 用 起 来 更 加 简单 ， 你 必须 将 这 些 复杂 的 东西 隐藏 起 来 。 

当 你 意识 到 初始 化 这 一 步骤 在 提交 其 他 函数 结果 之 前 必须 做 且 只 能 做 一 次 ,情况 将 变 得 
更 为 复杂 。 为 了 保证 初始 化 代码 不 会 每 次 都 执行 ， 你 需要 有 一 个 记录 是 否 已 初始 化 的 布尔 类 
型 标志 。 遗 憾 的 是 ， 将 这 一 标志 声明 为 全 局 变量 并 不 能 达到 目的 ， 因 为 在 C++ 中 不 能 指定 
全 局 变量 初始 化 的 次 序 。 如 果 你 声明 了 使 用 随机 库 函 数 产 生 的 值 初始 化 一 些 全 局 变量 ， 并 不 
能 保证 初始 化 标志 已 经 被 正确 设置 。 

在 C++ 中 ， 最 好 的 办 法 就 是 在 函数 代码 段 中 声明 初始 化 标志 来 检查 必要 的 初始 化 是 否 
已 经 完成 。 然 而 该 初始 化 标志 变量 不 能 被 定义 为 一 个 传统 的 局 部 变量 ， 因 为 这 样 做 意味 着 每 
一 次 调用 函数 都 将 产生 一 个 新 的 变量 。 为 了 使 这 一 标志 在 每 一 次 函数 调用 中 都 起 作用 ， 你 需 
要 将 该 变量 声明 为 static， 如 同 下 述 代码 : 

void initRandomSeed() ( 

static bool initialized = false; 
if ('initialized) { 
srand (int (time (NULL) ) ) ; 
initialized = true; 


} 
} 


当 使 用 关键 字 static 来 标记 initialized 变量 时 ， 它 将 成 为 一 个 静态 局 部 变量 
(static local variable)。 类 似 于 其 他 的 局 部 变量 ,一 个 静态 局 部 变量 只 在 函数 体 中 可 被 访问 。 
不 同 的 是 ， 对 于 该 类 变量 ， 编 译 器 只 进行 一 次 内 存 分 配 操作 ， 而 这 一 内 存 也 被 接 下 来 的 每 一 
次 initRandomSeed 函数 调用 所 共享 。C++ 语法 确保 静态 局 部 变量 只 被 初始 化 一 次 ， 而 且 
该 初始 化 发 生 在 该 函数 被 第 一 次 调用 时 的 该 变量 定义 点 。 定 义 initRandomSeed 函数 标志 
着 random. cpp 实现 代码 的 完成 ， 其 代码 如 图 2-14 所 示 。 

我 们 介绍 整个 编写 randcm. cpp 实现 代码 的 目的 并 不 是 想 要 掌握 其 中 的 所 有 难点 。 我 
们 希望 让 你 明白 为 何 作为 random.h 的 用 户 你 不 用 在 意 其 实现 的 所 有 细节 。random.cpp 
中 的 所 有 代码 都 是 极其 精妙 的 ， 并 且 其 中 也 存在 许多 陷阱 使 得 想 要 单独 实现 它 的 程序 员 可 能 
误 入 歧途 。 必 须 记 住 ， 库 接口 的 首要 目标 就 是 将 其 内 部 所 有 实现 的 复杂 性 对 用 户 隐 藏 起 来 。 


ps 
* File: random.cpp 


#include «cstdlib» 
#include <cmath> 
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#include <ctime> 
Kinclude "random.h" 
using namespace std; 


/* Private function prototype */ 


void initRandomSeed(); 
/* 


* implementation notes: randomInteger 


* 


The code for randomInteger produces the number in four steps: 


Generate a random real number d in the range [0 .. 1). 


Convert the result to the next lower integer. 

The implementation is complicated by the fact that both the expression 
RAND MAX + 1 

and the expression for the number of values 
high - low * 1 


can overflow the integer range. These calculations must therefore be 
performed using doubles instead of ints. 


+ + OX +++ © 00€ He + + + FF X* X* 


^ 


int randomInteger(int low, int high) ( 
initRandomSeed(); 
double d = rand() / (double(RAND MAX) + 1); 
double s = d * (double(high) - low + 1); 
return int(floor(low + s)); 


Implementation notes: randomReal 


The code for randomReal is similar to that for randominteger, 
without the final conversion step 


xj 


double randomReal(double low, double high) ( 
initRandomSeed () ; 
double d = rand() / (double(RAND MAX) + 1); 
double s - d * (high - low); 
return low * s; 


) 
/* 


* Implementation notes: randomChance 


The code for randomChance calls randomReal(0, 1) and then checks 
whether the result is less than the requested probability 


*/ 


bool randomChance (double p) { 
initRandomSeed(); 
return randomReal(0, 1) < p; 


) 
/* 


* Implementation notes: setRandomSeed 


* The setRandomSeed function simply forwards its argument to srand 
* The call to initRandomSeed is required to set the initialized flag 


aS 


void setRandomSeed(int seed) { 
initRandomSeed () ; 
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Scale the number to the range {0 .. N) where N is the number of values. 
Translate the number so that the range starts at the appropriate value. 
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srand(seed); 


* Implementation notes: initRandomSeed 
* The initRandomSeed function declares a static variable that keeps track 
* of whether the seed has been initialized. The first time initRandomSeed 
* is called, initialized is false, so the seed is set to the current time 
*/ 


void initRandomSeed() ( 
static bool initialized - false; 
if (!initialized) ( 
srand (int (time (NULL) )); 
initialized = true; 


) 





) 
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2.9 Stanford 类 库 介 绍 


BARAT AIR, 本 书 中 的 程序 只 使 用 了 C++ 中 一 小 部 分 标准 库 特 性 ， 以 保证 这 些 程序 可 
在 任何 类 型 硬件 上 的 C++ 编译 器 上 和 运行。 遗憾 的 是 ，C++ 标准 类 库 并 没有 包含 一 个 程序 员 
所 需要 的 所 有 特性 。 虽 然 大 多 数 的 现代 应 用 使 用 图 形 显 示 ， 但 是 标准 类 库 并 不 提供 图 形 处 理 
功能 。 每 一 个 现代 操作 系统 都 提供 了 支持 在 屏幕 上 画图 的 类 库 ， 但 是 这 些 类 库 之 间 并 不 相互 
兼容 。 为 了 创建 一 个 和 你 平常 使 用 的 一 样 有 趣 的 应 用 ， 在 某 些 地 方 你 会 使 用 非 标准 库 。 

作为 本 书 的 部 分 支持 材料 ， 斯 坦 福 大 学 提供 了 一 系列 让 你 可 以 更 加 轻松 愉悦 进行 C++ 
编程 的 类 库 ( Stanford 类 库 )。 这 些 类 库 包 括 了 一 个 图 形 处 理 包 ， 它 与 大 多 数 普通 计算 平台 
上 的 类 库 工 作 方式 相同 。Stanford 类 库 也 提供 了 本 章 所 讲 的 该 库 的 介绍 主页 。 在 我 们 讲解 并 
熟知 了 定义 和 实现 类 似 error.h、direction.h、gmath.h fll random. h 这 些 接口 的 设 
计 之 后 ， 必 须 明 白 拒绝 这 些 工 具 甚 至 强迫 潜在 用 户 拷贝 相关 的 代码 并 不 合理 。 由 于 每 个 接口 
最 终 都 会 在 应 用 开发 时 带 来 便利 ， 因 此 ， 最 好 的 做 法 是 将 接口 做 成 类 库 的 一 部 分 。 然 而 ， 建 
立 一 个 编译 类 库 超 出 了 本 书 的 范围 ， 主 要 原因 是 建立 编译 类 库 所 涉及 的 细节 在 不 同 的 机 器 平 
台 上 是 不 同 的 。 本 书 在 斯 坦 福 的 网 站 上 有 适合 学 生 可 能 使 用 的 所 有 主要 平台 的 预 编译 版 本 类 
库 。 你 可 以 从 网 上 下 载 这 些 类 库 ， 其 中 的 .h 后 级 文件 定义 了 类 库 的 接 日 。 为 了 和 弄 明 白 如 何 
在 你 的 工作 环境 下 使 用 Stanford 类 库 ， 你 可 能 需要 花 些 时 间 , 但 这 么 做 的 优点 将 在 之 后 很 快 
会 弥补 这 段 时 间 的 损失 。 
2.9.1 简单 的 输入 和 输出 类 库 

除了 本 章 所 介绍 的 类 库 接口 之 外 ，Stanford 类 库 还 包括 了 其 他 几 个 能 使 编程 变 得 更 容易 
的 接口 。 在 这 些 接口 中 ， 最 重要 的 就 是 simpio.h 接口 了 ,这 一 接口 简化 了 从 用 户 获取 输 
入 的 过 程 ， 与 以 下 几 行 代码 不 同 : 

int limit; 


cout «« "Enter exponent limit: " 
cin >> limit; 


使 用 simpio.h 允许 你 将 上 述 代码 行 简 化 为 下 述 一 行 代码 : 
int limit = getInteger("Enter exponent limit: "); 


尽管 使 用 simpio.h 后 代码 明显 缩短 ， 但 是 使 用 该 类 库 的 真正 优点 是 getInteger P 
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数 可 以 检查 用 户 的 输入 错误 。 例如， 假设 你 的 程序 正在 执行 下 面 这 行 代码 : 
int n = getInteger("Enter an integer: "); 


getInteger 函数 将 显示 提示 字符 串 Enter an integer: 并 等 竺 用户 的 输入 ， 如 下 图 所 示 : 





Enter an integer: 
àl 
| i 


pe ÜHr—— DACP; 





如 果 用 户 想 要 输入 数值 120， 但 在 该 输入 0 的 地 方 错误 地 输入 了 一 个 负 号 ，getInteget K 
数 将 会 检查 出 用 户 输 入 的 是 一 个 非法 的 整 型 值 ， 并 给 用 户 再 次 输入 正确 数值 的 机 会 ， 这 一 过 
程 如 下 图 所 示 : 





与 此 相反 ，>> 操作 符 并 不 检查 上 述 该 类 错误 。 如 果 用 户 在 执行 以 下 语句 时 输入 了 12-: 


cin >> n; 


则 变量 n 将 会 得 到 输入 值 12， 并 将 负 号 保留 在 输入 流 cin 中 。 

除了 getInteger 之 外 ，simpio.h 接口 还 提供 了 用 于 读 取 浮 点 数 的 getReal 函数 
和 用 于 读 取 一 整 行 字符 串 的 getLine PR. TER 4 章 你 将 会 学 习 如 何 实现 这 些 函 数 ， 现 在 
你 可 以 先 通过 使 用 来 熟悉 它们 。 

Stanford 类 库 还 包括 了 一 个 控制 台 类 库 ， 它 在 程序 开始 运行 时 会 在 屏幕 上 弹出 一 个 控 
制 台 和 窗口。 控制 台 和 窗口 的 自动 弹出 解决 了 丹尼斯 * 里 奇 在 其 著作 《 C 程序 设计 语言 》( The C 
Programming Language) 中 所 提 及 的 问题 ,， 即 运行 程序 时 的 一 个 挑战 就 是 : 结果 要 输出 到 哪 
Hi? 为 了 使 用 这 个 库 ， 你 需要 在 程序 的 开始 部 分 加 上 以 下 这 一 行 代码 : 


#include "console.h" 


如 果 加 入 了 这 一 行 代码 ， 程 序 就 会 建立 一 个 控制 台 窗口 ， 如 果 程 序 中 缺失 这 一 行 代码 ， 它 仍 
会 正常 运行 ， 只 是 不 弹出 控制 台 窗口 而 已 。 


2.9.2 Stanford 类 库 中 的 图 形 处 理 程序 


将 C++ 作为 一 种 教学 语言 的 挑战 就 是 C++ 未 提供 标准 图 形 库 。 虽 然 在 不 使 用 图 形 界面 
的 情况 下 ， 我 们 可 以 很 好 地 学 习 数 据 结 构 和 算法 ， 但 在 学 习 过 程 中 加 入 图 形 库 将 使 学 习 过 程 
变 得 更 加 有 趣 。 并 且 由 于 学 习 变 得 更 加 有 趣 你 将 更 容易 接受 新 知识 ， 因 此 ，Stanford 类 库 包 
含 了 一 个 可 以 在 大 多 数 普通 平台 上 使 用 的 二 维 图 形 处 理 类 库 包 。 

图 形 处 理 类 库 最 主要 的 接口 是 gwindow .h， 该 接口 提供 了 一 个 可 以 创建 图 形 窗口 的 类 
GWindow。 为 了 在 屏幕 上 画图 ， 需 要 声明 一 个 GWindow 类 的 对 象 ， 然 后 调用 其 中 的 对 象 方 
法 。 虽 然 GWindow 类 提供 了 大 量 的 方法 ,但 本 书 中 的 程序 仅 使 用 了 表 2-2 中 所 示 的 方法 。 
所 有 图 形 处 理 包 基本 上 都 提供 了 与 表 2-2 所 示 功 能 类 似 的 方法 ， 因 此 ， 熟 悉 本 书 中 对 图 形 处 
理 库 的 使 用 将 使 你 更 易于 使 用 其 他 类 似 的 类 库 。 
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图 2-15 是 一 个 简单 的 图 形 应 用 程序 ， 设 计 该 简单 应 用 程序 的 目的 是 用 于 说 明 表 2-2 中 
的 方法 ， 而 不 是 为 了 绘画 。 程 序 的 输出 呈现 在 图 2-16 中 。 


GWindow gw; 
GWindow gw (width, height) ; 
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X 2-2 Gwindow 类 中 的 方法 


创建 一 个 图 形 窗口 ， 它 通常 存储 在 变量 gw 中 。 该 变量 必须 通 
过 引用 传递 给 完成 图 形 操作 。 若 参数 值 width 和 height B, W) 
构造 函数 创建 了 一 个 默认 尺寸 为 500 x 300 像素 的 窗口 


.drawLine (xo, yo, Xn Yı) ; 画 一 条 从 点 Gro yo). 到 点 (x4wy1 ) 的 线段 
.drawPolarLine (x, y, r, theta) ; 从 点 (x, y) 开始 画 一 条 长 度 为 "像素 ， 与 +x 轴 间 夹 角 为 6 
: 的 线段 。 该 方法 将 在 第 8 章 做 更 详细 的 介绍 
. drawRect (x, y, width, height) ; 根据 特定 的 参数 画 一 个 矩形 框 
.fillRect (x, y, width, height) ; 根据 特定 的 参数 填充 矩形 
. drawOval (x, y, width, height) ; 根据 特定 的 参数 画 一 个 矩形 的 内 切 椭圆 
.fillOval (x, y, width, height) ; 根据 特定 参数 填充 矩形 的 内 切 椭圆 
设置 当前 的 绘图 颜色 。 形 参 color 是 一 个 命名 颜色 的 字符 串 。 
ccna i 定义 的 颜色 名 列表 以 电子 文档 给 出 
-getWidth () ; 返回 图 形 窗口 的 宽度 ， 单 位 为 像素 
.getHeight|); 返回 图 形 窗口 的 长 度 ， 单 位 为 像素 


* This program illustrates the use of graphics using the GWindow class 


*f 
#include "gwindow.h" 
/* Prototypes */ 


void drawDiamond(GWindow & gw); 
void drawRectangleAndOval(GWindow & gw); 


/* Main program */ 


int main() ( 
GWindow gw; 
drawDiamond (gw); 
drawRectangleAndOval (gw); 
return 0; 


Function: drawDiamond 
Usage: drawDiamond(gw): 


Draws a diamond connecting the midpoints of the window edges 


void drawDiamond(GWindow & gw) { 
double width - gw.getWidth(); 
double height = gw.getHeight(); 
gw.drawLine(0, height / 2, width / 2, 0); 
gw.drawLine(width / 2, 0, width, height / 2); 
gw.drawLine(width, height / 2, width / 2, height); 
gw.drawLine(width / 2, height, 0, height / 2); 
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* Function: drawRectangleAndOva 
* Usage: drawRectangleAndOval (gw 
* — À —————— em — t — - -— soe 
* Draws a blue rectangle and a gray 
void drawRectangleAndOval (GWindow & gw) { 
double width = gw.getWidth(); 
double height = gw.getHeight () ; 
gw.setColor ("BLUE") ; 
gw.fillRect (width / 4, height / 4, width / 2, height / 2); 
gw.setColor ("GRAY") ; 
gw.fillOval (width / 4, height / 4, width / 2, height / 2); 
KI 2-15 (48) 
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图 2-16 简单 的 图 形 示例 输出 


GraphicsExample 程序 的 第 一 行 声 明了 一 个 用 于 实现 图 形 操作 的 Gwindow 类 对 象 ， 
最 简单 的 声明 方法 如 下 所 示 : 

GWindow gw; 

该 声明 创建 了 一 个 小 型 的 图 形 窗口 ， 并 在 屏幕 上 显示 该 窗口 。 同 时 ， 你 可 通过 调用 
GWindow 类 的 以 下 构造 函数 来 设置 窗口 的 大 小 : 

GWindow gw (width, height) ; | 
上 述 构 造 函 数 的 形 参 width 和 height 的 单位 为 像素 (pixel)， 它 是 屏幕 上 的 一 个 点 

WE gw 的 所 有 图 形 操作 都 由 其 所 属 类 GWindow 中 的 方法 实现 。 因 此 ， 所 有 使 用 图 形 
的 代码 段 都 必须 通过 变量 gw 来 访问 。 如 果 你 将 程序 分 解 为 几 个 函数 ， 那 么 需要 以 引用 参数 
的 方式 在 访问 并 操作 窗口 中 图 形 的 函数 之 间 传 递 gw 值 。 

图 形 窗口 中 的 坐标 使 用 数值 对 (x, y) 来 表示 ， 其 中 ，x 和 y 的 值 表示 了 它 距离 坐标 原点 
(origin) (0, 0) 的 距离 ， 该 原点 处 于 屏幕 窗口 的 左上 角 。 正 如 传统 的 第 卡尔 坐标 系 ， 当 你 将 
点 在 窗口 中 向 右 移 动 时 ， 变 量 x 的 值 将 增加 。 而 原点 在 左上 角 使 得 变量 y 的 值 会 随 点 坐标 值 

pu] 向 下 移动 而 增加 ， 这 刚好 与 传统 的 笛 卡 尔 坐 标 完全 相反 。 计 算 机 图 形 包 反 转 了 y 坐标 轴 ， 因 
为 这 样 做 使 文本 在 屏幕 上 看 起 来 更 自然 。 如 果 变 量 y 的 值 随 点 的 下 移 而 增加 ， 那 么 连续 的 多 
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行文 本 也 将 使 得 行 数 y 逐 行 增加 。 


本 章 小 结 
本 章 我 们 学 习 了 函数 ， 函 数 使 你 可 以 用 盯 数 名 来 调用 一 系列 特定 的 操作 。 函 数 作为 一 
个 从 概念 上 降低 编程 复杂 性 的 重要 工具 ， 人 允许 程序 员 忽略 其 内 部 细节 ， 只 关注 函数 的 最 终 


功能 。 


本 章 包括 以 下 要 点 : 


函数 是 一 个 代码 块 ， 它 组 织 成 具有 上 因 数 名 并 享有 独立 的 内 存 空间 。 函 数 一 旦 被 定义 ， 
则 程序 的 其 他 部 分 可 以 调用 该 阴 数 ， 通 过 实 参 列表 向 函数 传递 信息 并 通过 函数 的 返 
回 值 传 回 结果 。 

函数 在 编程 中 起 到 以 下 重要 作用 。 人 允许 相同 的 指令 集 被 多 个 不 同 的 程序 分 享 以 降低 
程序 的 规模 和 复杂 性 。 更 重要 的 是 ， 函 数 让 程序 可 以 被 分 解 为 更 小 ， 更易 管 理 的 多 
个 代码 片段 。 同 时 ， 函 数 是 解决 特定 计算 问题 算法 的 实现 基础 。 

当 函 数 被 聚集 到 类 库 中 时 ， 它 们 将 变 得 更 加 有 用 ， 因 为 它们 可 被 不 同 的 应 用 程序 所 
共享 。 每 一 个 库 都 会 定义 若干 个 具有 相同 概念 框架 的 函数 。 在 计算 机 科学 中 ， 通 过 
一 个 库 使 其 中 的 一 个 函数 可 用 的 过 程 称 作 叶 出 该 函数 。 

«cmath» 库 提供 了 若干 与 数学 概念 上 相似 的 函数 ,包括 sart, sin 和 cos。 作 为 
«cmath» 库 的 用 户 ， 你 不 需要 知道 其 中 函数 的 实现 细节 ， 仅 需 知道 如 何 调用 它们 
即 可 。 

在 C++ 中， 函数 在 使 用 之 前 必须 先 声明 。 函 数 声明 又 称 为 函数 原型 。 除 了 函数 原 
型 ， 函 数 还 需 有 其 实现 ， 它 定义 了 函数 执行 的 每 一 个 步骤。 

有 返回 值 的 函数 必须 要 有 一 个 return iA), ESAT RANE aR. RAT 
返回 任意 类 型 的 结果 。 返 回 布尔 类 型 的 函数 在 编程 中 起 着 重要 的 作用 ， 被 称 为 判定 
BES 

仅 执 行 函 数 中 的 语句 完成 特定 功能 但 不 返回 值 的 函数 称 为 过 程 。 

C++ 语言 允许 使 用 同名 来 定义 多 个 函数 ， 只 要 编译 器 能 够 通过 函数 参数 的 个 数 及 类 
型 来 确定 到 底 调用 的 是 哪个 函数 即 可 。 此 多 个 同名 的 函数 称 为 函数 名 的 重 载 。 用 于 
区 别 不 同 重 载 函 数 版 本 的 参数 形式 称 为 签名 。C++ 语言 可 以 定义 默认 参数 ， 用 户 在 
调用 函数 时 可 省 略 相应 的 实 参 。 

函数 内 定义 的 变量 局 部 于 该 郴 数 ， 不 可 在 函数 外 使 用 。 事 实 上 ， 琐 数 内 定义 的 所 有 
的 局 部 变量 被 全 部 存储 在 栈 帧 中 。 

函数 调用 时 ， 实 参 被 求 值 后 将 其 值 拷 贝 到 函数 原型 定义 的 形 参 交 量 中 ， 并 且 ， 实 参 
和 形 参 顺序 要 一 一 对 应 。 

C++ 人 允许 函数 的 调用 者 通过 将 变量 用 “区 ”标记 传 和 函数， 以 便 在 函数 中 共享 其 变 
量 值 。 这 种 类 型 的 参数 传递 被 称 为 引用 调用 。 

当 函 数 返 回 时 ， 程 序 将 返回 函数 调用 点 继续 执行 。 计 算 机 将 该 点 称 为 返回 地 址 并 将 
其 存储 在 栈 帧 中 以 便 跟踪 。 

创建 库 的 程序 员 称 为 库 的 实现 者 ; 使 用 库 的 程序 员 称 为 该 库 的 用 户 。 实 现 者 和 用 户 
之 间 的 连接 件 被 称 为 接口 。 接 口 通常 可 提供 函数 、 数 值 类 型 和 常量 定义 ， 它 们 被 统 
称 为 接口 入 口 。 


78 


RIF 








在 C++ 中 ,接口 被 保存 在 以 .h 为 后 缀 名 的 头 文 件 中 。 每 一 个 接口 应 该 包含 预 编 译 
头 来 确保 编译 器 仅 读 取 该 接口 一 次 。 

当 设 计 一 个 接口 时 ， 必 须 平 衡 多 个 设计 需求 。 一 个 好 的 接口 设计 具有 统一 性 、 简 单 
性 、 充 分 性 、 通 用 性 和 稳定 性 。 

random.h 接口 提供 了 若干 可 简化 模拟 随机 行为 的 函数 。 

在 本 章 所 定义 的 几 个 接口 (error.h、direction.h、gmath.h 和 random.h) 
是 Stanford 类 库 中 的 一 部 分 ,以便 用 户 可 以 不 必 重 写 其 代码 而 直接 使 用 。Stanford 
类 库 还 同时 定义 了 另外 几 个 有 用 的 接口 ， 包 括 用 于 简化 输入 /输出 的 库 ( simpio. 
h)， 用 于 产生 与 控制 台 交 互 的 库 (console.h)， 和 在 屏幕 上 用 于 显示 图 形 窗 口 的 库 


(gwindow.h). 


复习 题 


1. 用 你 自己 的 语言 解释 函数 和 程序 的 区 别 。 

2. 定义 函数 中 的 几 个 专业 术语 : 调用 、 实 参 、 返 回 。 

3. 判断 题 : C++ 程序 中 每 个 函数 都 需要 一 个 函数 原型 。 

4. <cmath> 库 中 的 sqrt AZI RJR EtA? 

5. 在 一 个 函数 体 中 可 以 存在 多 个 return 语句 吗 ? 

6. 什么 是 判定 函数 ? 

7. 什么 是 函数 重 载 ? C++ 编译 器 是 如 何 使 用 签名 来 实现 函数 重 载 的 ? 

8. 如 何 为 形 参 定义 默认 值 ? 

9. 判断 题 : 在 函数 第 二 个 形 参 没有 定义 默认 值 的 情况 下 可 以 为 第 一 个 形 参 定义 默认 值 。 
10. 什么 是 栈 帧 ? 

11. 描述 实 参 与 形 参 的 关联 过 程 。 

12. 函数 中 定义 的 变量 被 称 为 局 部 变量 。 这 一 术语 中 “局 部 ”是 什么 含义 ? 
13. 术语 引用 调用 的 具体 含义 是 什么 ? 

14. 在 C++ 程序 中 ， 如 何 表 示 引 用 调用 ? 

15. 定义 以 下 库 中 的 术语 : 用 户 、 实 现 、 接 口 。 

16. 如 果 你 正在 编写 一 个 名 称 为 mylib.h 的 接口 ,那么 在 预 编 译 头 中 你 会 写 上 什么 语句 ? 
17. 描述 使 接口 提供 常量 定义 的 过 程 。 

18. 本 章 介绍 的 接口 设计 过 程 应 遵循 哪些 核心 准则 ? 

19. 稳定 性 对 于 一 个 接口 而 言 为 何如 此 重要 ? 

20. 什么 是 伪 随 机 数 ? 

21. 在 大 多 数 电脑 上 ，RAND_MAX 常量 的 值 是 多 少 ? 

22. 将 rand 函数 的 返回 结果 转换 成 不 同 区 间 上 整数 值 的 四 个 步骤 是 什么 ? 
23. 如 何 使 用 randomInteger 天 数 来 生成 1 到 100 之 间 的 伪 随 机 数 ? 


24. 通过 手动 执行 randomInteger 函数 的 每 一 条 语句 ， 判 断 该 函数 在 负数 条 件 下 会 产生 什么 结果 。 


车 调用 函数 randonInteger(-5,5) 会 产生 什么 结果 ? 

25. 假设 变量 al 和 d2 已 经 被 声明 为 整 型 变量 ， 我 们 是 否 可 以 使 用 以 下 多 重 赋值 语句 : 
dl = d2 = RandomInteger(1, 6); 
来 模拟 掷 两 颗 山 子 的 过 程 ? 

26. 判断 题 : 每 一 次 程序 运行 ，rand 函数 都 会 产生 相同 的 随机 数 序 列 。 

27. 在 随机 数 中 ， 什 么 是 随机 数 种 子 ? 
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28. 在 介绍 随机 数 时 ， 本 章 为 程序 调试 提出 了 什么 建议 ? 
29. 最 终 版 本 的 random. h 接口 定义 了 哪些 函数 ? 在 什么 情况 下 会 使 用 这 些 函 数 ? 


习题 

1. 如 果 你 还 未 重 写 第 1 章 习 题 1 中 的 摄氏 度 - 华氏 度 转换 程序 ， 可 以 试 着 重 写 该 程序 ， 并 使 用 函数 来 
完成 这 种 温度 的 转换 。 

2. 使 用 一 个 函数 重新 实现 第 1 章 习 题 2 中 的 长 度 转换 程序 。 此 时 ， 函 数 必须 同时 产生 转换 成 尺 的 数值 
和 转换 成 英寸 的 数值 ， 这 也 意味 着 你 需要 通过 引用 调用 来 返回 这 些 值 。 115 

3. FE CH 中; 当 一 个 浮 点 数 被 转换 成 整 型 数 时 ， 数 值 的 小 数 部 分 会 被 直接 舍 去 。 因 此 ， 将 4.999 99 转换 为 
整 型 数 时 ， 结 果 是 4。 在 许多 场合 ， 将 浮 点 数 转换 为 最 接近 的 整 型 数 将 会 更 有 用 。 现 有 一 个 浮 点 型 变量 x, 
尔 可 以 通过 将 变量 加 上 0.5 并 舍 去 小 数 部 分 来 得 到 其 最 接近 的 整数 。 因 为 数值 四 舍 五 人 取 整 时 会 朝 着 数 
轴 上 0 的 方向 ， 所 以 负数 取 整 时 需要 为 其 数值 减 去 0.5， 而 不 是 加 上 0.5。 编 写 一 个 roundToNearestInt 
(x) 函数 ， 将 浮 点 数 取 整 为 与 其 最 接近 的 整数 ， 并 编写 一 个 适当 的 main 函数 来 验证 它 。 

4. 如 果 你 碰 上 寒冷 、 大 风 的 天 气 ， 你 对 温度 的 感觉 不 仅 取决 于 温度 ， 还 取决 于 风速 。 风 速 越 高 ， 越 觉 
得 寒冷 。 为 了 量化 风速 对 于 温度 感觉 的 影响 ， 国 家 气象 局 做 出 了 风寒 指数 报告 ， 该 部 门 网 站 上 的 风 
寒 指 数 说 明 如 图 2-17。 
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Wind Chill (°F) = 35.74 + 0.6215T - 35.75(V96) + 0.4275T(V9-5) 
Where, T= Air Temperature (°F} V=Wind Speed (mph) Effective 11/01/01 





Source: National Weather Service 


图 2-17 温度 与 风速 的 风寒 指数 函数 116 


正如 你 在 图 2-17 的 底部 所 看 到 的 ， 国 家 气象 局 使 用 以 下 公式 计算 风寒 指数 : 
35.74 + 0.6215 (— 35.75 y + 0.4275 t , ^ 
其 中 , t 是 华氏 温度 ,，v 是 风速 ， 单 位 是 英里 /小 时 。 
编写 一 个 函数 windchil1， 参 数 为 t 和 v， 返 回 风寒 指数 。 为 了 达到 这 一 目 ,你 的 函数 必须 考 
虑 到 以 下 两 个 情况 : 
e 如 果 没 有 风 ，windchil1l 必须 返回 原始 温度 to 
e 如 果 温 度 高 于 40 下， 风寒 指数 未 定义 ， 此 时 你 的 函数 必须 使 用 正确 的 信息 来 调用 error 函数 。 
虽然 在 第 4 章 学 习 如 何 格式 化 数据 之 后 ， 你 可 以 很 轻松 地 编写 出 这 种 应 用 程序 ， 但 现在 所 学 的 
知识 已 经 足够 使 你 将 数据 做 出 排列 来 输出 类 似 图 2-17 所 示 的 风寒 指数 表 的 所 有 行 。 如 果 你 想 要 挑战 
自己 ， 编 写 一 个 使 用 windchil11l 函数 的 main 函数 来 输出 这 个 表格 。 
S. 希腊 数学 家 热衷 于 寻找 其 值 与 自身 所 有 真 因子 (proper division) 的 和 相等 的 数 。 其 中 ， 真 因子 是 指 
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除了 该 数 本 身 的 其 他 所 有 因子 。 数 学 上 将 符合 上 面 定 义 的 数 称 为 完全 数 (perfect number). (4, 6 
是 一 个 完全 数 ， 因 为 6 的 所 有 3 个 可 以 被 6 整除 的 真 因子 是 1、2 和 3， 它 们 之 和 正好 等 于 6。 类 似 
地 ，28 也 是 一 个 完全 数 ， 因 为 28 的 真 因子 1、2、4、7 和 14， 其 和 为 28。 

编写 一 个 判定 函数 isPerfect， 函 数 传人 整 型 值 n， 如 果 n 是 完全 数 ， 函 数 返回 true， 如 果 
不 是 则 返回 false。 通 过 编写 一 个 main ARIA isPerfect 检查 从 1 到 9999 中 的 完全 数 来 测 
试 函数 的 实现 。 当 找到 一 个 完全 数 时 ， 将 它 在 屏幕 上 显示 出 来 。 刚 开始 的 两 行 输出 会 是 6 和 28。 你 
的 程序 需要 在 给 定 的 数值 区 间 中 找到 另外 两 个 完全 数 。 

一 个 比 1 大 的 整数 如 果 除 了 自身 和 1 之 外 没有 其 他 因子 ， 则 被 称 为 素数 ( prime)。 例 如 17 就 是 一 
素数 ， 因 为 除了 1 和 17 之 外 没有 其 他 数 可 以 整除 它 。91 不 是 素数 ， 因 为 它 还 可 以 被 7 和 13 整除 。 
编写 一 个 判定 函数 isPrime(n), ， 如 果 整 数 n 是 素数 ， 则 返回 true， 反 之 则 返回 false. JT 
试 你 的 算法 ， 编 写 一 个 main 函数 来 列 出 1 到 100 之 间 的 素数 。 


.虽然 <cmath> 库 的 用 户 不 需要 了 解 函 数 sqrt 的 底层 实现 ， 但 是 这 个 库 的 实现 者 应 会 设计 一 个 高 


效 的 算法 ， 并 编写 出 其 主要 的 代码 来 实现 它 。 如 果 不 使 用 类 库 来 实现 函数 sqrt， 还 有 很 多 种 方法 
可 以 采用 。 最 简单 的 策略 是 采用 逐步 逼近 法 (successive approximation)， 这 种 方法 通过 在 开始 时 做 
出 预测 ， 之 后 不 断 通 过 提高 其 求 值 精度 来 得 到 新 值 ， 使 得 其 数值 逼近 最 终结 果 
你 可 以 通过 以 下 步 又 使 用 逐步 通 近 法 来 求 得 x 的 平方 根 : 
C1) 开始 时 ， 将 平方 根 值 取 为 x/2， 赋 值 给 g。 
(2) 实际 的 平方 根 结果 必须 处 于 g 和 g/x 之 间 。 在 逐步 通 近 法 的 每 一 步 ， 通 过 计算 g 和 g/x 的 平均 值 
得 到 一 个 新 的 近似 值 。 
(3) 不 断 重复 第 2 步 直到 g 和 g/x 两 值 都 足够 接近 ， 并 达到 硬件 允许 的 精度 要 求 为 止 。 在 C++ 中 ， 
最 好 的 检验 方法 就 是 测试 平均 值 与 产生 该 值 的 两 个 数值 是 否 相 等 。 
使 用 上 述 方法 编写 你 自己 的 sqrt 函数 。 
虽然 在 计算 最 大 公约 数 的 算法 中 ， 欧 几 里 得 算法 是 最 古老 的 且 非 常 实用 的 算法 ， 但 是 在 几 个 世纪 之 
前 也 产生 了 很 多 其 他 算法 。 在 中 世纪 ， 需 要 使 用 复杂 算法 的 问题 就 是 确定 复活 节 的 日 期 ， 它 是 每 年 
春分 后 第 一 次 圆 月 出 现 之 后 的 第 一 个 星期 天 。 从 其 定义 中 我 们 知道 : 计算 包括 了 每 周 日 期 的 变换 、 
月 亮 的 轨道 以 及 黄道 带 上 太阳 的 位 置 。 早 期 解决 这 一 问题 的 算法 要 追溯 到 3 世纪 ， 并 在 8 世纪 被 学 
者 Venerable Bede 记录 在 其 著作 中 。1800 年 ， 德 国 数学 家 高 斯 出 版 了 一 本 计算 复活 节日 期 的 算法 书 ， 
该 算法 通过 计算 得 出 ， 而 不 是 查 表 。 从 德 文 翻译 过 来 的 该 算法 如 图 2-18 BUR 
编写 一 个 过 程 : 


void findEaster(int year, string & month, int & day); 


它 通过 引用 参数 month 和 day 为 某 个 特定 的 年 year 返回 其 复活 节日 期 。 

遗憾 的 是 ， 图 2-18 中 的 算法 仅 在 18 世纪 和 19 世纪 有 效 。 然 而 ， 通 过 网 络 我 们 可 以 很 轻易 地 找 
到 适合 所 有 年 份 的 这 一 算法 的 扩展 版 本 。 在 你 完成 高 斯 这 一 算法 的 实现 之 后 ， 试 着 找到 计算 这 一 日 
期 更 通用 的 算法 。 


I 某 年 份 分 别 用 19、4 和 7 相 除 ， 并 将 其 余数 分 别 存 人 a、b 和 c 中 。 若 除数 为 偶数 ， 则 设 其 余数 为 0; 不 考虑 商 。 
以 下 除法 与 之 相同 。 
II. 用 19a 十 20 除 以 30， 记 其 余数 至 d 中 。 


II 最 后 ， 用 28 十 4c 十 6d 十 3 或 25 十 4c 十 6d 十 4 除 以 7， 其 中 ， 第 一 个 式 子 的 年 份 应 在 1700 和 1799 之 间 ， 而 第 二 个 
式 子 的 年 份 应 在 1800 和 1899 之 间 ， 将 其 余数 记 入 到 e 中 。 
然后 ,复活 节日 期 应 为 3 月 22 十 d+e 日 ， 或 者 当 d+e 大 于 9 时 ， 其 复活 节日 期 应 为 4 月 dre-9 日 。 





译 自 卡尔 、 弗 里 德里 克 高 斯 的 “计算 复活 节 的 日 期 ”，1800 年 8 月 。 
http://gdz.sub.uni-goettingen.de/no cache/dms/load/img/?IDDOC-137484 


图 2-18 计算 复活 节日 期 的 高 斯 算法 
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9. 本 章 介 绍 的 组 合 函 数 C (nk). 可 计算 出 从 mn 个 元 素 的 集合 中 忽略 排列 顺序 选取 k 个 值 共 有 多 少 种 取 
法 。 如 果 考 虑 数值 的 排列 情况 ， 则 在 之 前 的 硬币 选择 例子 中 ， 选 择 一 个 2 角 5 分 硬币 再 选择 一 个 1 
角 硬 币 ， 与 先 选 择 一 个 1 角 硬 币 再 选择 一 个 2 ffi 5 分 硬币 是 不 一 样 的 ， 要 计算 这 种 情况 ， 你 需要 使 
用 不 同 的 函数 ， 也 就 是 排列 函数 〈( permutation )。 排 列 函 数 计算 从 mn 个 元 素 的 集合 中 选取 有 序 的 K 个 
元 素 共 有 多 少 种 取 法 。 这 一 函数 用 P (nk) 标记 ， 并 具有 如 下 数学 公式 : 


n! 
(n — k)! 


P(n, k) = 


虽然 从 数学 上 来 说 ， 这 一 定义 是 正确 的 ， 但 是 在 实际 使 用 中 并 不 合适 ， 因 为 即使 最 终结 果 数 值 
较 小 ， 其 中 包含 的 因子 也 有 可 能 因为 太 大 而 无 法 存储 在 一 个 整 型 变量 中 。 举 例 来 说 ， 如 果 你 尝试 使 
用 这 一 公式 计算 从 52 张 卡片 中 选取 2 张 卡 片 的 排列 数 ， 最 终 会 得 到 下 面 的 式 子 : 


NO 658 175 170 943 878 571 660 636 856 403 766 975 289 505 440 883 277 824 000 000 000 000 
30414 093 201 713 378 043 612.608 166 064 768 844 377 641 568 960 512 000 000 000 000 


虽然 最 后 得 到 的 结果 并 不 大 , 为 2652 (52x 51) 1. 
编写 一 个 函数 Permutations-(n,k)， 在 不 调用 函数 fact 的 情况 下 计算 函数 P(n,k)。 这 一 
阶段 你 的 部 分 工作 就 是 找 出 如 何 高 效 地 计算 出 这 个 数字 。 你 可 能 会 发 现 如 果 使 用 一 些 相 对 较 小 的 数 
值 来 并 清楚 公式 中 分 子 和 分 母 的 行为 是 很 有 用 的 。 119 

10. 本 章 介绍 的 函数 C (nk). 和 上 述 习 题 中 的 函数 P (nk) 总 是 能 在 计算 机 数学 计算 中 见 到 ， 特 别 是 在 
组 合 数学 (combinatorics) 这 一 领域 ， 组 合 数学 更 专注 于 各 种 物体 组 合 方法 的 数量 。 现 在 你 已 经 使 
用 C++ 实现 了 这 两 个 函数 ， 接 下 来 最 好 的 办 法 就 是 将 这 两 个 函数 放 和 人 到 库 中 ， 这 样 你 才能 在 许多 
不 同 的 应 用 场合 调用 它们 。 

编写 库 文 件 combinatorics.h 和 combinatorics.cpp， 它 提供 函数 permutations 和 
combinations。 当 你 编写 其 实现 时 ， 确 保 你 重 写 了 combinations 函数 的 实现 代码 ， 使 其 能 利 
用 你 在 习题 9 中 的 排列 函数 中 的 更 高 效 算法 。 

11. 以 direction.h 接口 为 例 ， 设 计 并 实现 一 个 calendar.h 接口 ， 该 接口 提供 第 1 章 中 的 数值 类 
型 Month, WAX daysInMonth 和 isLeapYear。 该 接口 还 必须 提供 一 个 monthToSstring 
函数 来 返回 Month 类 型 值 的 常量 名 。 编 写 一 个 main 程序 要 求 用 户 输入 年 份 ， 然 后 输出 该 年 份 所 
有 月 份 的 天 数 来 测试 你 的 实现 代码 。 就 像 以 下 程序 输出 : 











|NOVEMBER has 30 days. M 
v| 


y ei my 





12. 编写 一 个 程序 RandomAverage， 它 不 断 地 产生 一 个 0 到 1 之 间 的 随机 实数 ， 并 在 用 户 输入 指定 
的 输入 次 数 之 后 显示 其 平均 数 。 
13. RAF He LH SRF 





PAR a + 爱 因 斯 坦 ，1947 
除了 爱 因 斯 坦 形 而 上 的 反对 声音 之 外 ， 现 在 流行 的 物理 模型 ， 特 别 是 量子 力学 都 认为 大 自然 实 
际 上 存在 随机 过 程 。 例 如 ， 我 们 人 类 无 法 了 解 原子 为 什么 衰变 。 实 际 上 ， 原 子 在 特定 时 期 会 随机 性 
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地 训 变 。 训 变 有 时 发 生 ， 有 时 不 发 生 ， 而 且 没 有 办 法 准确 预测 它们 是 否 会 发 生 。 
因为 物理 学 家 将 原子 的 衰变 过 程 看 成 是 一 个 随机 过 程 ， 因 此 我 们 可 以 使 用 随机 数 来 模拟 这 一 过 
程 一 点 也 不 奇怪 。 想 象 一 下 开始 你 拥有 一 簇 原子 ， 每 一 个 原子 在 任何 时 刻 以 一 定 的 概率 发 生 衰变 。 
你 可 以 通过 将 每 个 原子 纳入 考虑 范围 ， 并 根据 其 概率 随机 决定 其 是 否 衰变 来 近似 地 模拟 衰变 过 程 。 
编写 一 个 模拟 10 000 个 原子 组 成 的 材料 的 衰变 过 程 的 程序 ， 其中， 每 个 原子 每 年 有 50% 的 概 
率 会 发 生 衰变 。 程 序 必须 输出 在 每 年 年 末 时 还 剩余 多 少 个 原子 ， 如 下 图 所 示 : 





| 

| 

| re 

|There are 1215 atoms year 

|There are 612 atoms at the end of year 4 | 

| There are 296 atoms at the end of year 5. | 

[Sans anb. 14S shoes ME Ebh end of ques 6. 

There are 66 atoms at the end of year 7. i 

|There are 37 atoms at the end of year 8. | 

| There are 15 atoms at the end of year 9. 

There are 8 atoms at the end of year 10. f 

| There are 2 atoms at the end of year 11. d 

|There are 0 atoms at the end of year 12. 2 

X 

sA 








正如 上 图 输出 数据 所 表明 的 那样 ， 每 年 有 大 约 一 半 的 原子 样品 会 发 生 衰变 现象 。 在 物理 上 ， 这 
种 现象 我 们 就 称 这 一 样品 的 半衰期 (half-life) 为 一 年 。 


14. 随机 数 还 提供 了 另 一 种 逼近 圆周 率 值 的 方法 。 想 象 一 下 墙 上 挂 着 一 个 靶子 ， 这 个 靶子 是 画 在 正方 形 


上 的 一 个 圆 形 ， 如 下 图 所 示 : 


CA 





h d 


如 果 你 完全 随机 地 向 靶子 掷 出 一 连 串 飞镖 ， 并 且 忽 略 所 有 没有 落 在 正方 形 上 的 飞镖 ， 这 时 会 发 
生 什 么 情况 呢 ? 有 一 些 飞 镖 会 落 在 灰色 区 域 ， 但 有 一 些 却 会 落 在 圆 外 正方 形 的 白色 区 域 。 如 果 你 扔 
出 时 是 随机 的 ， 则 射 在 灰色 区 域 飞镖 数量 与 白色 部 分 飞镖 数量 的 比率 将 大 致 等 于 灰色 部 分 面积 和 白 
色 部 分 面积 的 比率 。 面 积 的 比率 与 靶子 的 总 面积 似乎 并 不 相关 ， 这 可 以 通过 以 下 公式 说 明 : 


圆 内 的 灰色 部 分 圆 的 面积 x mn 


正方 形 内 的 灰色 部 分 。”” 正方 形 的 面积 — 4r 4+ 
为 了 让 程序 模拟 这 一 过 程 ， 想 象 一 下 靶子 被 画 在 标准 的 笛 卡 尔 坐 标 系 中 ， 中 心 点 在 原点 上 ， 并 
且 半 径 为 1 单位 长 度 。 掷 飞镖 的 过 程 可 以 通过 产生 两 个 随机 数 x 和 y 来 建 模 ， 两 个 坐标 变量 取 值 都 
在 一 1 和 1 之 间 。 点 (x, y) 始终 会 落 在 正方 形 之 中 。 如 果 符 合 以 下 条 件 ,， 点 x, y) 就 落 在 圆 中 : 


Vx? +y? < 1 
然而 这 一 条 件 可 以 通过 将 不 等 式 两 边 同 时 取 平 方 进行 简化 ， 使 得 计算 更 加 高 效 : 
r+y<1 
如 果 你 多 次 模拟 这 一 过 程 ， 并 计算 飞镖 落 入 圆 中 的 概率 ， 结 果 会 接近 7/4, 
编写 一 个 程序 ， 模 拟 掷 出 10 000 支 飞 镖 ， 然 后 使 用 本 习题 中 的 模拟 技术 产生 并 显示 圆周 率 的 
近似 值 。 不 用 担心 你 得 到 的 结果 只 在 刚 开 始 的 几 个 小 数位 上 是 正确 的 。 此 方法 在 计算 该 问题 上 并 不 
是 特别 精确 ， 我 们 只 是 想 通 过 这 一 例子 来 证 明 相 似 技术 的 可 用 性 。 在 数学 上 ， 这 一 技术 称 为 蒙特 卡 
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洛 积分 法 (Monte Carlo integration)， 这 是 一 座 坐 落 在 摩纳哥 首都 旁边 的 城市 ， 因 其 赌场 而 出 名 。 
15. 正面 … 
ru 
fen 
在 一 定 的 概率 下 ， 如 果 没 有 任何 其 他 情况 发 生 ， 一 个 弱者 可 能 会 重新 审视 他 的 信仰 。 
一 一 汤姆 * 斯 托 帕 德 ,《 罗 森 克 兰 茨 和 吉尔 登 斯 特 因 已 死 》Rxencrantz and Guildenstern Are Dead, 1967 
编写 一 个 模拟 重复 抛 硬币 过 程 的 程序 ， 一 直 抛 直 到 连续 三 次 正面 朝 上 。 此 时 ， 你 的 程序 必须 显 
示 出 共 抛 了 多 少 次 硬币 。 下 面 是 一 个 可 能 的 程序 运行 例子 : 122 





先 从 上 往 下 ， 彩 虹 的 六 条 色 带 分 别 是 : 红 、 橙 、 黄 、 绿 、 蓝 和 品 红 ， 并 用 蓝 绿色 作为 天 空 的 可 爱 
颜色 。 

17. 使 用 图 形 库 编写 一 个 在 图 形 窗口 中 画 出 国际 象棋 棋盘 的 程序 。 你 的 图 画 必须 包括 红 棋 和 黑 棋 ， 并且 
棋子 的 位 置 如 以 下 游戏 刚 开始 那样 : 





123 


18. 道家 哲学 原理 就 是 阴阳 二 气 之 间 没 有 明显 的 界线 ， 甚 至 在 边界 之 间 也 混合 着 很 多 其 他 人 可 以 明显 看 
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到 的 相反 的 方面 。 这 一 思想 体现 在 八卦 图 上 ， 图 中 每 一 个 区 域 都 拥有 男 一 种 颜色 的 小 点 : 





编写 一 个 图 形 处 理 程序 ， 它 可 在 图 形 窗口 的 中 央 画 出 八卦 图 。 其 挑战 在 于 你 只 能 使 用 表格 2-2 
124 中 的 方法 来 分 解 绘画 。 这 也 意味 着 其 中 没有 可 以 画 出 弧 线 和 半圆 形 的 方法 。 
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Programming Abstractions in C++ 


字符 品类 string 


她 在 这 些 弦 上 弹拨 出 低 声 的 音乐 。 





托马斯 斯 特 尔 那 斯 : 艾 略 特 ,《 荒原 》1922 


截至 目前 ， 你 在 本 书 中 看 到 的 大 多 数 示 例 程 序 都 使 用 数值 作为 程序 的 基本 数据 类 型 。 如 
今 ， 计 算 机 被 单纯 用 于 处 理 数值 的 场合 越 来 越 少 ， 更 多 的 时 候 ， 计 算 机 被 用 于 处 理 文本 数据 
(text data)， 而 所 谓 的 文本 数据 ， 一 般 指 的 是 由 多 个 独立 字符 构成 的 信息 。 现 代 计 算 机 处 理 
文本 数据 的 强大 能 力 已 经 催生 了 诸如 手机 短信 、 电 子 邮件 、 文 字 处 理 系 统 、 网 上 图 书馆 和 其 
他 多 种 多 样 实 用 的 应 用 程序 。 

在 这 一 章 中 ,我 们 将 介绍 C++ 语言 中 的 <string> 类 库 ， 该 类 库 向 我 们 提供 了 方便 操 
作 字 符 串 的 抽象 。 熟 练 使 用 这 一 类 库 ， 可 以 使 你 更 容易 地 编写 出 有 趣 的 应 用 。 在 本 章 ， 我们 
还 将 介绍 类 (class) 的 概念 ， 这 一 概念 已 经 被 计算 机 科学 家 采用 ， 并 应 用 于 指 代 面向 对 象 编 
程 范式 中 的 数据 类 型 。 虽 然 C++ 语言 定义 了 一 个 更 原始 的 字符 串 类 型 ， 但 是 string 类 对 
象 在 大 多 数 文本 处 理应 用 中 具有 更 高 的 使 用 频率 。 在 本 章 中 ， 学 习 string 类 并 掌握 其 应 
用 将 会 加 深 你 对 于 类 这 一 概念 的 理解 ， 同 时 为 你 在 第 6 章 中 定义 自己 的 类 打下 坚实 的 基础 。 


3.1 使 用 字符 串 作 为 抽象 数据 


从 理论 上 来 说 ， 一 个 字符 串 〈string) 指 的 是 一 个 特定 的 字符 序列 。 例 如 ， 字 符 串 
“hello,world” 中 包含 了 10 个 字母 \1 个 逗号 和 1 个 空格 的 由 12 个 字符 组 成 的 字符 序列 。 
在 C++ 语言 中 ，string 类 和 其 相关 操作 被 定义 在 «string» 类 库 里 ， 因 此 ， 你 必须 在 所 
有 操作 字符 串 数据 的 源 代码 中 包含 该 类 库 。 

在 第 1 章 中 ， 你 已 经 知道 数据 类 型 包含 两 个 属性 : 值 域 和 操作 集 。 对 于 字符 串 来 说 ， 其 
定义 域 很 容易 进行 界定 : string 类 型 的 定义 域 是 字符 串 序列 集 。 一 个 更 有 趣 的 问题 是 如 何 
确定 合适 的 操作 集 。 早 期 的 C++ 语言 版 本 效仿 了 旧版 本 的 C 语言 ， 并 且 对 字符 串 操作 提供 
了 少量 支持 。 这 一 版 本 操作 所 提供 的 操作 机 制 被 定义 在 底层 运算 上 ， 因 此 ， 执 行 相应 操作 要 
求 你 理解 其 底层 表示 。 在 此 之 后 ，C++ 语言 设计 者 提出 了 字符 串 类 string， 并 很 好 地 解决 
了 该 问题 ，string 类 人 允许 用 户 在 更 抽象 的 水 平 上 处 理 字 符 串 。 

大 多 数 情况 下 ， 你 可 以 像 使 用 int double 类 型 一 样 将 string 类 当做 基本 数据 类 
型 来 使 用 。 例 如 ， 你 可 以 声明 各 种 各 样 的 string 类 型 变量 ， 并 赋 给 它 一 个 初始 值 ， 这 一 
操作 与 处 理 数值 变量 类 似 。 当 你 声明 一 个 string 类 型 变量 时 ， 你 一 般 赋 给 它 一 个 字符 串 
字面 值 ( string literal) 作为 初始 值 ， 该 值 是 用 双 引 号 括 起 来 的 一 个 字符 序列 。 例 如 我 们 可 以 


const string ALPHABET = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"; 


将 常量 ALPHABET 声明 为 包含 26 个 大 写字 母 的 字符 串 。 
你 也 可 以 使 用 操作 符 >> 和 << KE string 类 型 的 值 ， 当 然 这 一 操作 必须 小 心 谨慎 。 


地 
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例如 ， 你 可 以 通过 以 下 语句 改写 main 函数 ， 使 得 Hello 程序 更 具 交 互 性 ， 


int main() ( 
string name; 
cout «« "Enter your name: " 
cin »» name; 
cout «« "Hello, " «« name «« "!" << endl; 
return 0; E 


) 
该 程序 从 用 户 那 里 读 取 一 个 字符 串 并 赋值 给 变量 name， 之 后 将 用 户 输入 的 名 称 作 为 问候 语 
的 一 部 分 进行 输出 ， 该 程序 运行 结果 如 下 图 所 示 : 


i 












但 是 ， 假 如 你 输入 了 用 户 带 有 姓氏 的 全 名 而 不 是 单独 输入 名 称 ， 你 会 发 现 程序 产生 了 奇怪 的 
运行 结果 。 例 如 ， 若 在 输入 时 输入 我 的 全 名 ， 程 序 将 会 产生 如 下 输出 : 


er your name: Eric Roberts 
Hello, Eric! 


mein 


虽然 该 程序 并 没有 包含 用 于 将 我 的 全 名 分 解 成 两 部 分 的 代码 ， 但 当 它 输出 问候 语 时 ， 却 只 包 
含 了 我 的 名 字 而 忽略 了 我 的 姓 。 为 何 程序 能 够 产生 如 此 口语 化 的 输出 呢 ? 

为 了 回答 这 个 问题 ， 我 们 需要 更 深入 地 了 解 >> 操作 符 是 如 何 读 取 一 个 字符 串 值 的 。 虽 
然 你 希望 它 能 够 读 取 一 整 行 输入 ， 但 >> 操作 符 一 旦 遇 到 空白 字符 (whitespace character) 就 
会 停止 读 取 ， 这 里 ， 空 白字 符 被 定义 为 会 在 屏幕 上 显示 空白 间隔 的 字符 。 最 常见 的 空白 字符 
就 是 空格 ， 同 时 ， 在 空白 字符 集中 也 包括 制 表 符 和 行 末 标识 符 。 

如 果 你 想 读 取 一 个 包含 空白 字符 的 字符 串 ， 则 不 能 用 >> 操作 符 。 最 标准 的 方法 是 调用 
以 下 函数 : 

getline(cin, str); 
该 函数 从 控制 台 输 入 流 cin 读 取 一 整 行 字符 串 ， 并 存放 到 变量 str 中 ， 其 中 ，str 是 通过 
引用 进行 传递 的 。 包 含 getline MAN HelloName 程序 代码 如 图 3-1 所 示 ， 它 可 使 程序 
输出 用 户 的 全 名 ， 如 下 所 示 : 


full name: Eric Roberts 
! 


your 
Hello, Eric Roberts 





OT 


实际 操作 中 ， 读 取 一 整 行 字符 串 这 一 操作 比 读 取 两 端 被 空白 字符 分 隔 的 字符 串 更 加 常 
见 。 因 此 ， 那 些 需要 从 用 户 那里 读 取 完 整 字符 串 的 程序 更 多 地 使 用 了 getline 函数 (或 者 
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2.9 节 中 simpio.h 头 文件 中 包含 的 getLine 函数 )， 而 不 是 >> 操作 符 。 


/* 
* File: HelloName.cpp 
* 


* This program extends the classic "Hello world" program by asking 
* the user for a name, which is then used as part of the greeting. 
* This version of the program reads a complete line into name and 

* not just the first word. 

* 


#include <iostream> 
#ainclude <string> 
using namespace std; 


int main() { 
string name; 
cout << "Enter your full name: 
getline(cin, name); 
cout «« "Hello, " «« name «« "!" «« endl; 
return 0; 


". 
H 





图 3-1 “Hello World ”程序 的 一 个 交互 版 本 


3.2 FRIRE 


如 果 你 需要 使 用 <string> 类 库 来 执行 更 复杂 的 操作 ， 你 会 发 现 与 传统 数据 类 型 相 比 ， 
string 数据 类 型 的 表现 并 不 完全 相同 。 其 中 最 主要 的 差别 在 于 函数 调用 的 语法 。 假 如 我 们 
已 经 确定 <string> 库 中 提供 了 length 函数 ， 那 么 你 可 能 认为 可 以 通过 如 下 函数 调用 来 
计算 字符 串 长 度 : 


int nChars = length(str); Mm 


TE C++ 语言 中 ， 调 试 程序 时 上 述 语句 会 被 标记 为 错误 。 其 原因 在 于 string 数据 类 型 并 
不 是 一 种 传统 的 基本 数据 类 型 ， 它 是 一 个 类 ( class)， 这 种 类 型 被 简单 地 定义 为 一 个 包含 值 
集 和 相应 操作 集 的 模板 。 在 面向 对 象 编程 语言 中 ， 属 于 一 个 类 的 所 有 值 被 称 为 该 类 的 对 象 
(object) 。 一 个 类 可 拥有 多 个 不 同 对 象 ， 每 一 个 对 象 被 称 作 该 类 的 一 个 实例 (instance). 

应 用 于 类 实例 的 操作 被 称 为 方法 (method)。 在 C++ 语言 中 ， 方 法 的 使 用 和 操作 与 传 
统 函 数 类 似 。 但 我 们 给 它 起 一 个 新 的 名 字 是 为 了 强调 它们 的 不 同 。 与 函数 不 同 ， 方 法 与 它 
们 所 属 的 类 紧密 联系 。 强 调 这 种 差别 是 非常 有 意义 的 ， 传 统 的 函数 通常 称 为 自由 函数 ( free 
function)， 因 为 它们 不 被 约束 于 特定 的 类 。 

在 面向 对 象 程 序 设 计 中 ， 对 象 间 通过 信息 发 送 和 请 求 来 实现 对 象 间 的 通信 。 我 们 将 传 
递 的 这 些 信息 统称 为 消息 (message)。 对 象 间 的 消息 发 送 通常 理解 为 一 个 对 象 调 用 属于 另 一 
个 对 象 的 方法 。 为 了 与 发 送 消息 的 概念 模型 达成 一 致 ， 初 始 化 方法 的 对 象 称 为 消息 的 发 送 方 
(sender)， 消 息 的 目标 对 象 称 为 接收 方 (receiver), TE C++ 语言 中 ,我 们 使 用 如 下 语法 进行 
消息 的 发 送 : 

receiver . name (arguments) 
因此 ， 在 面向 对 象 语 言 中 ， 把 字符 串 对 象 str 的 长 度 赋 给 nchars 的 语句 如 下 : 


int nChars = str.length(); 


表 3-1 列 出 了 «string» 类 库 中 大 部 分 常用 方法 ， 它 们 都 使 用 以 上 接收 方 语法 进行 调用 。 
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字符 串 操 作 


stri + str; 


str += str; 
str; == str; str; != str; 
stri < stra. str; <= strz 
stri > str, stri >= str; 
str[k] 

读 字符 串 内 容 方法 


str. length () 


strat (k) 


str.substr (pos, n) 


str.compare (str;) 


str find (pattern, pos) 


修改 接收 方 字符 串 内 容 方法 


str.erase (pos, n) 


str.insert (pos, strz) 


str.ceplace (pos, n, strz) 


用 C++ 创建 C 风格 的 字符 串 方 法 


string (carray) 
string (n, ch) 


str.c_str() 


3.2.1 操作 符 重 载 











表 3-1 «string» 库 中 常见 的 方法 


连接 字符 串 st 和 sta， 返 回 一 个 连接 后 的 新 字符 串 。 其 中 str I stra 可 
以 替换 为 字符 类 型 ， 但 不 允许 替换 为 数字 类 型 

将 字符 串 stro 的 拷贝 添加 到 str WAR. CH 语言 重 载 了 这 个 操作 符 ， 使 
得 str; 可 以 为 字符 类 型 





这 些 操 作 符 用 于 比较 字符 串 sz Fil stra, 比较 标准 参照 字典 序 
(lexicographic order)， 字 典 序 由 字符 ASCII 码 值 定 义 


返回 字符 串 str 索引 位 置 k 上 的 字符 ，[] 操作 符 并 不 检测 k 是 否 在 其 合法 
的 范围 内 


返回 字符 串 str 中 字符 的 个 数 


返回 字符 串 str 中 索引 位 置 大 的 字符 。 与 [] 操作 符 相 有 反 ， 如 果 上 超出 了 其 
合法 值 范围 ， 则 ac 方法 会 产生 异常 


返回 一 个 新 的 字符 串 ， 该 字符 串 是 从 str 的 pos EFR, UA n 个 字符 
或 直到 sr 字符 串 未 尾 的 子 串 。 该 方法 的 第 二 个 参数 是 可 选 的 ， 若 无 参数 由 
子 串 总 是 会 延伸 至 str 字符 串 的 末尾 


比较 接收 方 字符 串 str 和 str;， 若 两 个 字符 串 相 等 ， 则 返回 一 个 整数 0 ; 如 
R str 字典 序 在 stri 之 前 ， 则 返回 一 个 负数 ; 如果 ser 字典 序 在 stri 之 后 ， 返 
回 一 个 正 数 。 因 为 C++ 重 载 了 关系 操作 符 ， 因 此 ， 程 序 员 很 少 明确 地 调用 
compare 方法 


在 接收 方 字符 串 str 中 ， 从 pos 位 置 开 始 查找 pattern FR, WIRE, WPR 
数 返 回 pattern (可 以 是 一 个 字符 或 一 个 字符 串 ) 所 出 现 的 第 一 个 索引 值 ; 如 
果 pattern 没有 出 现 ，find 返回 常量 string::npos, 方法 的 第 2 个 参数 
是 可 选 的 ; 如 果 不 提 供 第 2 个 参数 ， 则 find 方法 会 从 字符 串 头 开始 搜索 


从 str 的 pos 处 开始 向 后 删除 个 字符 
从 str 的 pos 处 开始 插入 stra 的 拷贝 
以 str; 替换 str 中 从 pos 处 开始 的 个 字符 


返回 一 个 与 carray 字符 串 相 同 字符 的 C++ 字符 串 
返回 一 个 包含 个 ch 字符 的 C++ 字 符 串 
返回 一 个 与 str 内 容 同 样 的 C 风格 字符 数组 


正如 你 在 表 3-1 的 第 一 部 分 所 看 到 的 ，<string> 类 库 通 过 使 用 C++ 语言 的 一 种 强大 
特性 重新 定义 了 标准 操作 符 ， 这 一 C++ 语言 特性 称 为 操作 符 重 载 (operator overloading)， 这 
一 特性 将 依据 操作 数 类 型 重新 定义 标准 操作 符 执行 的 操作 。 在 <string> 类 库 中 ， 最 重要 
的 重 载 操 作 符 是 + 符号， 当 + 被 应 用 到 数值 时 ， 它 执行 加 法 。 当 + 被 应 用 到 字符 串 时 ， 它 
完成 字符 串 的 连接 ( concatenation )， 这 是 一 个 精妙 的 符号 ， 可 以 将 两 个 字符 串 首尾 相连 组 合 
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成 新 的 字符 串 。 

你 也 可 以 采用 助 记 符 += 将 新 串 连接 到 另 一 个 字符 串 的 尾部 。+ 和 += 操作 符 都 允许 进 
行 字 符 串 或 单个 字符 之 间 的 连接 ， 正 如 下 面 的 例子 ， 它 将 字符 串 变 量 str IREN “abcd”: 

string str = "abc"; 

str += 'd'; 

如 果 你 熟悉 Java 语言 的 编程 ， 你 可 能 认为 + 操作 符 能 够 支持 将 其 他 类 型 的 值 转换 为 字 
符 串 值 ， 再 与 其 他 字符 串 进行 连接 的 运算 。 但 是 这 种 情况 在 C++ 中 是 不 允许 的 ， 因 为 C++ 
是 一 种 强 类 型 语言 ，C++ 会 把 企图 连接 两 个 类 型 互 不 相 容 操作 数 的 运算 当 作 是 一 个 错误 。 

C++ 语言 也 重 载 了 关系 操作 符 ， 相 比 于 其 他 语言 ， 包 括 C 语言 和 Java 语言 ， 你 能 够 更 
便捷 地 进行 字符 串 的 比较 。 例 如 ， 你 可 以 使 用 下 面 的 代码 检测 scr 的 值 是 否 等 于 “quit : 


if (str == "quit") ... 


关系 操作 符 使 用 字典 序 来 比较 字符 串 ， 在 底层 这 一 次 序 通过 ASCII 码 进行 定义 。 字 典 序 意 
味 字母 的 大 小 写 是 有 区 别 的 ， 所 以 “abc” 不 等 于 “ABC”。 


3.22 ”从 一 个 字符 串 中 选取 字符 


在 C++ 中 ,一 个 字符 串 中 字符 的 下 标 位 置 从 0 开始 。 例 如 ， 在 字符 串 “ hello， 

world” 中 以 数字 标识 的 字符 下 标 位 置 如 下 图 所 示 : 
RERBELLELERIEE 

其 中 ， 写 在 每 个 字符 下 面 的 位 置 数 称 为 该 字符 的 索引 (index). 

«string» 类 库 提 供 了 两 种 不 同 的 机 制 来 选取 字符 串 中 的 特定 字符 。 一 种 方法 是 将 索 
引 写 在 字符 串 后 面 的 方 括号 中 。 例 如 ， 如 果 字 符 串 变量 str 包含 “ hello,world”， 则 
以 下 表达 式 : 

str[0] 
指向 字符 串 str 的 起 始 字符 “h”， 虽 然 C++ 程序 员 倾 向 于 使 用 方 括号 语法 来 增加 编程 语 
言 的 可 读 性 ， 但 是 调用 at 方法 进行 访问 可 能 更 好 些 。 在 C++ 语言 中 ， 表 达 式 str[i] 和 
str.at (i) 有 着 几乎 相同 的 含义 ， 唯 一 的 不 同 在 于 at 要 检测 并 确保 索引 在 字符 串 合 法 的 
取 值 范围 内 。 

无 论 你 使 用 哪 种 语法 ， 从 字符 串 中 单独 选取 一 个 字符 将 会 返回 字符 串 中 对 应 字符 的 引 
用 ， 它 允许 你 对 该 字符 进行 单独 赋值 。 例 如 ， 你 可 以 使 用 以 下 语句 : 


str[0] = 'H'; 
或 者 以 下 另 一 语句 : 
str.at(0) = 'H'; 


将 字符 串 的 值 从 “hello，world” 更 改 为 “Hello，world”。 第 二 种 形式 可 以 对 函数 
返回 的 结果 进行 赋值 这 一 点 很 容易 让 人 困惑 ， 并 且 在 我 的 教学 经 验 中 发 现 学 生 对 于 使 用 at 
函数 的 写法 不 容易 理解 ， 所 以 虽然 方 括号 的 写法 并 不 会 执行 范围 检测 ， 但 在 本 书 的 示例 程序 
中 ， 我 依旧 选择 使 用 方 括号 来 选择 字符 串 中 的 字符 。 

虽然 字符 串 中 的 索引 位 置 从 概念 上 看 是 一 个 整数 ， 但 是 string 类 依旧 定义 了 size t 
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类 型 值 来 代表 索引 位 置 和 字符 串 长 度 ， 这 也 使 得 该 类 的 使 用 变 得 更 复杂 。 如 果 你 想 让 你 的 编 
码 完全 正确 地 通过 编译 ， 每 一 次 你 用 一 个 变量 存储 一 个 字符 串 索 引 时 ， 你 应 该 使 用 size t 
类 型 (该 类 型 已 经 在 <string> 类 库 中 默认 自动 定义 ) 的 变量 。 在 斯 坦 福 大 学 ， 我 们 已 经 发 
HEH size t 会 使 程序 在 概念 上 变 得 更 加 复杂 ， 并 且 变 得 更 加 难以 理解 ， 因 此 ， 我 们 选择 
使 用 int 类 型 来 代替 size t 类 型 。 尽 管 程序 编译 时 某 些 编译 器 可 能 会 弹出 一 个 警告 消息 ， 
但 是 除非 你 的 字符 串 比 2 147 483 647 个 字符 长 度 更 长 ， 否 则 使 用 inc 类 型 的 效果 会 更 好 。 


3.2.3 字符 串 赋 值 
为 了 减轻 用 户 可 以 更 改 已 存在 字符 串 中 的 单个 字符 值 这 一 概念 问题 的 影响 ，C++ 采取 了 
某 些 措施 。C++ 重新 定义 了 字符 串 赋值 操作 ， 人 允许 我 们 将 一 个 字符 串 赋值 给 另 一 个 ， 这 么 做 
132] 将 使 用 字符 串 的 底层 拷贝 进行 赋值 。 例 如 以 下 赋值 语句 : 


str2 = strl; 


用 stri 中 字符 的 拷贝 来 重 写 str2 之 前 的 内 容 。 变 量 stri 和 str2 因此 仍 保持 独立 ， 这 
意味 着 改变 stri 中 的 字符 并 不 影响 str2。 类 似 地 ，C++ 在 任意 字符 串 中 复制 字符 都 是 将 
字符 作为 一 个 参数 值 进行 传递 的 。 因 此 ， 除 非 字符 串 参 数 使 用 引用 传递 ， 否 则 在 函数 中 对 传 
人 参数 的 更 改 并 不 会 影响 到 函数 外 的 实 参 值 。 


3.24 提取 字符 串 中 的 子 串 


在 连接 较 短 字符 串 以 形成 更 长 的 字符 串 运算 后 ， 你 经 常 需要 先 做 相反 的 工作 : 将 一 个 字 
符 串 分 解 成 数 个 短片 段 。 一 个 较 长 字符 串 的 一 部 分 称 为 其 子 串 (substring), string 类 提供 了 
一 个 带 有 两 个 参数 的 方法 substr， 其 中 第 一 个 参数 为 提取 字符 串 子 串 的 起 始 位 置 ， 第 二 个 
参数 为 欲 提取 的 子 串 字 符 个 数 。 调 用 函数 str .substr (start, n), 将 从 start 指定 的 
索引 位 置 开 始 在 str 中 提取 一 个 n 个 字符 的 子 串 。 例 如 ， 如 果 str 包含 字符 串 "hello, 
world"， 如 下 调用 方法 : 


str.substr (1, 3) 


将 返回 包含 3 个 字符 的 子 串 “el1”。 由 于 C++ 中 的 下 标 从 0 开始， 在 索引 位 置 1 处 为 字符 'e' 。 
E substr 方法 中 第 二 个 参数 是 可 选 的 ， 如 果 第 二 个 参数 省 略 ，substr 返回 一 个 从 指定 位 
置 开 始 持续 到 该 字符 串 结尾 的 子 串 。 因 此 ， 如 以 下 调用 方法 : 


str.substr(7) 


将 返回 字符 串 "world", Ki, WR n 是 已 知 的 ， 但 指定 的 开始 位 置 后面 少 于 n 个 字 
^f, substr 只 返回 原始 字符 串 指定 位 置 到 字符 串 结尾 的 子 串 。 

下 面 的 函数 调用 将 返回 参数 str 的 后 半 段 子 串 ， 如 果 scr 的 长 度 为 奇数 ， 则 其 子 串 将 
包含 最 中 间 的 字符 。 

string secondHalf(string str) ( 


return str.substr(str.length() / 2); 
) 


3.2.5 在 一 个 字符 串 中 进行 搜索 


有 时 ， 你 会 发 现 搜 索 一 个 字符 串 看 它 是 否 包含 某 个 特定 字符 或 子 串 是 很 有 用 的 。 为 了 完 
成 这 样 的 搜索 ，string 类 提供 了 一 个 名 为 fina 的 方法 ， 该 方法 有 几 种 形式 。 最 简单 的 调 
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用 形式 是 : 
str.find (search); 
HP, search 是 欲 搜 索 的 内 容 ， 它 可 以 是 一 个 字符 串 ， 也 可 以 是 一 个 字符 。 当 find 方法 被 调 
用 时 ， 它 会 搜索 search 在 字符 串 str 第 一 次 出 现 的 索引 位 置 。 如 果 索 引 值 被 找到 ， 则 find 
返回 搜索 内 容 的 开始 的 索引 位 置 。 如 果 搜 索 内 容 在 字符 串 结 束 之 前 没有 找到 ， 则 find 返回 
常量 string:: npos。 与 你 在 第 1 章 看 到 过 的 常量 不 同 ， 标 识 符 npos 被 定义 为 string 
类 的 一 部 分 ， 因 此 ， 一 且 它 在 程序 中 出 现 ， 则 要 求 必 须 用 string:: 限定 符 进行 约束 。 
find 方法 还 有 一 个 可 选 的 第 二 参数 ， 该 参数 指出 从 何 处 开始 进行 搜索 。 我 们 假设 变量 
str 包含 字符 串 "hello, world", find 函数 调用 的 两 种 版 本 将 产生 如 下 结果 : 


str.find('o') — 4 
str,find('o', 5) — 8 
str.find('x') — str::npos 


和 字符 串 比 较 一 样 ， 搜 索 字 符 串 的 方法 认为 大 小 写字 符 是 不 同 的 。 


3.2.6 ”循环 人 遍历 字符 串 中 的 所 有 字符 


虽然 string 类 提供 的 方法 为 你 创造 了 免 于 从 零 开 始 的 实现 字符 串 应 用 的 工具 ， 但 是 
通过 利用 已 有 的 常见 操作 实现 代码 实例 ， 通 常 能 更 容易 地 编写 出 程序 。 用 编程 术语 来 讲 ， 这 
些 示 例 性 的 程序 被 称 为 模式 (pattern)。 当 你 操作 字符 串 时 ， 其 中 一 个 最 重要 的 模式 就 是 循 
环 遍历 字符 串 中 的 字符 ， 完 成 该 功能 所 需要 的 代码 如 下 : 

for (inti = 0; i < str.length(); i++) ( 


. . body of loop that manipulates str[i] . .. 
) 
在 上 述 代码 运行 的 每 次 循环 中 ， 表 达 式 strli] 都 选取 字符 串 中 的 第 i 个 字符 。 因 为 循环 
的 目的 是 为 了 处 理 字 符 串 中 的 每 个 字符 ， 所 以 循环 会 一 直 持 续 直 到 i 的 值 达到 字符 串 的 长 度 
为 止 。 因 此 ， 可 通过 下 面 的 函数 来 计算 一 个 字符 串 中 空格 的 数目 : 
int countSpaces(string str) { 
int nSpaces = 0; 
for (int i = 0; i < str.length(); i++) { 
if (str[i] == ' ') nSpaces++; 
) 


return nSpaces; 


} à 
对 于 某 些 应 用 ， 需 要 反 向 循环 遍历 一 个 字符 串 ， 即 从 字符 串 的 最 后 一 个 字符 开始 ， 反 向 
迭代 直至 到 达到 字符 串 中 的 第 一 个 字符 。 这 种 反 向 迭代 需要 以 下 的 for 循环 语句 : 

for (int i = str.length() - 1; i >= 0; i--) 
此 时 ， 字 符 串 索 引 值 i 是 从 最 后 的 索引 位 置 开始 ， 即 开始 时 i 的 值 等 于 字符 串 的 长 度 减 1, 
然后 它 在 每 次 循环 中 递减 ， 直 至 减 小 到 索引 值 为 0。 

假如 你 已 经 理解 了 for 语句 的 语法 和 语义 ， 根 据 第 一 原则 ， 你 可 以 很 容易 地 在 每 一 次 
该 模式 出 现时 判断 其 中 每 一 次 迭代 的 情况 。 但 是 ， 这 样 做 会 极 大 地 降低 你 的 编码 效率 。 这 些 
迭代 模式 必须 熟 记 ， 你 不 应 该 浪费 任何 时 间 去 回想 分 析 它 们 。 当 你 确认 你 需要 循环 遍历 字符 
串 中 的 字符 时 ， 你 的 思维 必须 能 很 快 地 将 迭代 过 程 转化 为 以 下 代码 : 
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for (inti = 0; i < str.length(); i++) 


对 于 某 些 应 用 而 言 ， 你 需要 对 基本 迭代 模式 做 出 修改 ， 使 得 开始 和 结束 的 索引 位 置 不 
同 。 例 如 ， 下 面 的 函数 检测 一 个 字符 串 是 否 以 特定 的 前 级 开始 : 
bool startsWith(string str, string prefix) ( 
if (str.length() « prefix.length()) return false; 
for (int i — 0; i « prefix.length(); i++) ( 
if (str[i] != prefix[i]) return false; 
} 


return true; 


} 

这 段 代码 的 开始 部 分 是 检测 并 确保 str 的 长 度 不 小 于 prefix WKE (万 一 出 现 这 种 情况 ， 
135) 结果 一 定 为 false)， 然后 循环 遍历 prefix 中 的 字符 而 不 是 整个 str FAR, 

当 你 阅读 startswith 函数 的 代码 时 ， 需 要 特别 关注 其 中 的 两 个 return 语句 的 位 
置 。 一 旦 发 现 str prefix 之 间 有 一 个 不 同 的 字符 ， 在 循环 内 部 就 立即 返回 false. 4 
代码 检测 完 prefix 的 每 个 字符 ， 并 且 在 比较 时 没有 发 现任 何 的 不 同 字符 后 ， 在 循环 的 外 部 
返回 true。 在 你 阅读 本 书 时 ， 你 会 多 次 发 现 上 述 程序 基本 模式 的 实际 应 用 例子 。 

在 本 章 习 题 1 中 ， 你 将 有 机 会 编写 startswith 函数 和 类 似 的 endswith 函数 。 虽 
然 在 C++ 语言 中 ， 它 们 并 不 是 标准 <string> 类 库 的 一 部 分 ， 但 经 验 已 经 证 明 它 们 是 非 
常 有 用 的 。 它 们 是 字符 串 函 数 库 完美 的 候选 者 ， 你 可 以 尝试 通过 应 用 第 2 章 定 义 的 error 
类 库 时 使 用 的 技术 将 这 些 函 数 包含 在 自 定义 类 库 中 。Stanford 类 库 还 包含 一 个 能 提供 数 个 
有 用 的 字符 串 函 数 的 接口 ， 接 口 名 为 strlib.n, 我 们 将 在 3.7 节 对 该 接口 进行 更 加 详细 
的 介绍 。 


3.2.7 ”通过 连接 扩展 字符 串 


在 学 习 字符 串 时 ， 还 有 一 个 非常 有 意义 的 编程 模式 值得 你 去 学 习 并 铭记 ， 这 一 模式 通过 
一 次 一 个 字符 ， 逐 步 创建 一 个 完整 字符 串 。 循 环 结构 本 身 将 依赖 这 个 应 用 ， 但 是 通过 连接 创 
建 字符 串 的 一 般 模式 如 下 所 示 : 


string str = "" 
for (whatever loop header line fits the application) ( 
str += the next substring or character; 


} 
作为 一 个 简单 的 示例 ， 下 面 的 方法 返回 一 个 由 n 个 ch 字符 拷贝 组 成 的 字符 串 : 


string repeatChar(int n, char ch) { 
string str - "" 
for (int i= 0; i < n; i++) ( 
str += ch; 
) 
return str; 
) 


上 述 repeatChar 函数 在 某 些 场合 中 是 很 实用 的 ， 例 如 当 你 需要 在 控制 台 上 输出 某 类 章节 
分 隔 符 的 时 候 。 要 完成 此 目的 ， 其 中 一 个 策略 如 下 : 


cout << repeatChar(72, '-') << endl; 


它 将 打印 由 72 个 连 字符 号 “- ”组 成 的 一 行 字符 。 
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许多 字符 串 处 理 函 数 将 迭代 和 连接 模式 一 起 使 用 。 例 如 ， 下 面 的 函数 将 参数 字符 串 进行 
逆序 处 理 ， 例 如 ， 调 用 函数 reverse ("desserts") KREIFI E "stressed": 
string reverse(string str) { 
string rev = " 
for (int i = str.length() - 1; i >= 0; i--) ( 
rev += str[i]; 


) 


return rev; 


) 
3.8 «cctype» 库 

由 于 字符 串 是 由 字符 组 成 的 ， 处 理 字符 串 中 的 单个 字符 而 不 是 整个 字符 串 的 操作 就 显得 非 
常 必 要 。<cctype> 库 提供 了 人 处理 字 符 串 中 字符 的 各 种 函数 ， 其 中 最 常见 的 函数 如 表 3-2 所 示 。 

# 3-2 的 第 一 部 分 定义 了 一 组 判断 函数 以 检测 字符 串 中 的 一 个 字符 是 否 属于 一 个 特定 的 
类 别 。 例 如 ， 如 果 ch ‘0’ — '9' 之 间 范 围 内 的 一 个 数字 字符 ， 调 用 isdigit (ch) 
函数 将 返回 结果 trues 

表 3-2 在 <cctype> 库 中 的 部 分 函数 

检验 字符 类 型 的 判断 函数 


isalpha (ch) 如 果 ch 是 一 个 字母 字符 ， 则 返回 true 

isupper (ch) 如 果 ch 是 一 个 大 写字 母 字 符 ， 则 返回 true 

islower (ch) 如 果 ch 是 一 个 小 写字 母 字 符 ， 则 返回 true 

isdigit (ch) A ch 是 一 个 数字 ('0' 一 '9' )， 则 返回 true 

Dae E nina E ti (ror a "9', tA* e tg, tat este), Rx 


如 果 ch 是 一 个 字母 数字 混合 的 (alphanumeric) 字符 ， 则 返回 tzue。 一 个 
字母 数字 意味 着 它 要 么 是 一 个 字母 ， 要 么 是 一 个 数字 


ispunct (ch) 如 果 ch 是 一 个 标点 符号 ， 返回 true 


MR ch 是 一 个 空白 字符 ， 则 返回 true, © ' (空格 字符 )、'\t'、'\n'、'\ 
f'、'\v' 和 '\r' 都 被 认为 是 空白 字符 


isprint (ch) 如 果 ch 是 任意 可 打印 的 字符 ， 则 返回 true 


isalnum (ch) 


isspace (ch) 


大 小 写 转换 函数 





返回 ch 对 应 的 大 写字 母 GE ch 不 是 一 个 字母 则 为 ch 本 身 ) 
返回 ch 对 应 的 小 写字 母 (GE ch 不 是 一 个 字母 则 为 ch 本 身 ) 


toupper (ch) 












tolower (ch) 


类 似 地 ， 如 果 ch 是 任意 一 个 在 显示 屏 上 显示 为 空白 字符 的 字符 ， 例 如 空格 字符 和 制 
XT, JS isspace (ch) 将 返回 true。 表 3-2 第 二 部 分 的 函数 使 得 大 写字 母 和 
小 写字 母 之 间 的 转换 变 得 十 分 容易 。 例 如 ， 调 用 toupper ('a')， 则 返回 字符 'A'。 如 
果 toupper 3X tolower 子 数 的 参数 不 是 一 个 字母 ， 函 数 返 回 它 原来 传人 的 参数 ， 因 此 
tolower ('7') 返回 '7'。 

当 处 理 字符 串 时 ，<cctype> 库 中 的 函数 的 应 用 经 常 能 够 做 到 信 手 挡 来 。 例 如 ， 如 果 参 
数 str 是 一 个 非 空 的 数字 字符 串 ， 下 面 的 函数 返回 true， 这 意味 着 它 代表 一 个 整数 : 


b 
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bool isDigitString(string str) ( 
if (str.length() == 0) return false; 
for (int i = 0; i < str.length(); i++) ( 
if (!isdigit(str[i])) return false; 
) 


return true; 


} 
类 似 地 ， 当 和 忽略 大 小 写 时 ， 如 果 字 符 串 sl Al s2 相等 ， 则 下 面 的 函数 返回 true: 


bool equalsIgnoreCase(string sl, string s2) { 
if (sl.length() != s2.length()) return false; 
for (int i = 0; i < sl.length(); i++) ( 
if (tolower(sl[i]) != tolower(s2[i])) return false; 
} 
return true; 


} 
PRAM equalsIgnoreCase 在 忽略 大 小 写 情 况 下 ,一 旦 发 现 字符 串 sl s2 第 一 个 不 匹配 
的 字符 时 ， 则 返回 false， 否 则 直到 循环 结束 才 返 回 trues 


3.4 ”修改 字符 串 中 的 内 容 


与 其 他 例如 Java 这 样 的 语言 不 同 ，C++ 语言 允许 通过 给 字符 串 中 的 一 个 特定 的 索引 位 
置 赋 新 值 来 改变 字符 串 中 的 字符 。 这 使 得 你 可 以 设计 自 定义 字符 串 操 作 函 数 去 改变 一 个 字符 串 
中 的 内 容 ， 就 像 删 除 (erase)、 插 入 (insert) 和 替换 (replace) 方法 所 做 的 一 样 。 然 而 ， 在 大 多 
数 情 况 下 ， 最 好 编写 函数 以 使 它们 能 返回 一 个 字符 串 的 转换 版 本 而 不 改变 原 有 字符 串 的 内 容 。 
我 们 举 一 个 例子 说 明 对 字符 串 内 容 进行 修改 的 两 种 不 同 的 方法 。 假 设 你 想 设 计 一 个 与 


_<cctype> 库 中 toupper 函数 对 应 的 自 定 义 函 数 ， 它 等 效 地 将 字符 串 中 的 每 个 小 写字 符 转 换 成 


大 写字 符 。 一 种 方法 是 实现 一 个 会 改变 原来 实 参 字符 串 中 内 容 的 过 程 ， 该 实现 方法 如 下 所 示 : 


void toUpperCaseInPlace(string & str) ( 
for (int i = 0; i < str.length(); i++) { 
str[i] = toupper(str[i]); 
) 
) 


-PERKIRAAN PRG IE SEES BALA WAS HS DL, FFL AN ICA BOR II 
实 参 值 。 如 果 你 同时 使 用 迭代 和 连接 模式 ， 函 数 可 能 像 下 面 这 样 : 


string toUpperCase(string str) ( 
string result - ""; 
for (int i = 0; i < str.length(); i++) ( 
result += toupper(str[i]); 
} 
return result; 


} 
上 述 修 改 字符 串 的 策略 有 时 非常 高 效 ， 此 外 它 更 灵活 ， 并 且 出 现 意外 结果 的 可 能 性 更 
低 。 然 而 ， 利 用 第 一 个 程序 代码 ， 可 将 第 二 个 程序 代码 进行 改写 ， 使 其 更 加 高 效 : 


string toUpperCase(string str) { 
toUpperCaseInPlace (str); 
return str; 


} 
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在 上 述 这 段 代 码 实现 中 ，C++ 自动 复制 实 参 字 符 串 ， 因 为 参数 是 值 传递 的 。 鉴 于 str 不 再 
连接 到 调用 域 的 参数 字符 串 ， 在 某 些 地 方 修 改 它 然后 返回 一 个 复制 字符 串 给 它 的 调用 者 是 完 
全 可 以 接受 的 。 


3.5 遗留 的 C 风格 字符 串 


早期 C++ 语言 的 成 功 部 分 归 因 于 其 包含 了 C 语言 作为 子 集 ， 使 得 它 能 从 一 种 语言 逐渐 
过 渡 到 男 一 种 语言 。 然 而 ， 这 种 设计 决策 意味 着 C++ 依然 包含 C 语言 的 某 些 特性 ， 而 Ci 
言 的 这 些 特性 在 现代 面向 对 象 程序 设计 语言 中 不 再 有 意义 ， 尽 管 如 此 ， 我 们 仍 需 保留 C++ 
语言 的 兼容 性 。 

在 C 语言 中 ,字符 串 是 以 底层 的 字符 数组 来 实现 的 ， 不 提供 string 类 中 的 高 级 机 制 。 
遗憾 的 是 ， 使 C++ 和 C 保持 兼容 这 项 决策 导致 C++ 必须 支持 两 种 风格 。 例 如 ，string F 
面值 就 是 基于 传统 的 C 语言 风格 实现 的 。 在 大 部 分 情况 下 ， 你 都 可 以 忽略 其 历史 细节 ， 因 
为 当 编 译 器 能 够 确定 你 想 要 的 是 一 个 C++ 字符 串 时 ，C++ 语言 会 自动 将 一 个 字符 串 字 面值 
转换 成 一 个 C++ 字符 串 。 如 果 你 用 下 面 这 行 代码 初始 化 一 个 string 对 象 : 


string str - "hello, world"; 


C++ 会 自动 将 C 风格 的 字符 串 字 面值 "hello， world" 转换 成 一 个 C++ 的 string 类 型 
对 象 ， 因 为 你 已 经 告诉 编译 器 str 是 一 个 string 类 型 的 变量 。 但 是 ，C++ 不 允许 你 编写 
类 似 以 下 这 样 的 声明 语句 : 


string str = "hello" +", " + "world"; L4 


即使 该 声明 看 起 来 和 上 条 语句 好 像 都 会 产生 相同 的 结果 。 但 此 处 的 问题 是 该 代码 版 本 尝试 将 
十 操作 符 应 用 到 非 C++ string 对 象 的 字符 串 字面 值 上 。 

如 果 你 需要 回避 这 一 问题 ， 你 可 以 通过 明确 调用 string 类 对 字符 串 字面 值 的 处 理 函 数 ， 
将 一 个 字符 串 字 面值 转换 成 一 个 字符 串 对 象 。 例 如 ， 下 面 的 这 行 代码 能 正确 地 将 "hello" 
转换 成 一 个 C++ 的 string 对 象 ， 然 后 采用 连接 方式 完成 string 对 象 初始 值 的 计算 : 


string str = string("hello") + ", " + "world"; 


C++ 中 字符 串 的 两 种 不 同 表示 产生 了 另外 一 个 问题 ， 即 一 些 C++ 库 要 求 使 用 C 风格 的 
字符 串 来 代替 更 现代 化 的 C++ string 类 。 如 果 你 在 一 个 使 用 C++ 字符 串 应 用 的 上 下 文中 
使 用 这 些 抽 象 库 函数 ， 你 必须 在 某 个 地 方 将 C++ 字符 串 对 象 转 换 成 其 对 应 的 C. 风格 字符 串 。 
这 种 转换 非常 简单 : 你 所 需要 做 的 就 是 使 用 C++ 版 本 字符 串 作为 参数 调用 c_str 方法 ， 进 
而 获取 它 的 等 价 C 风格 字符 串 。 然 而 ， 更 重要 的 问题 是 ， 字 符 串 的 两 种 不 同 表 示 我 们 都 需 
要 掌握 ， 这 增加 了 C++ 概念 的 复杂 性 ， 使 得 它 更 难以 学 习 。 


3.6 ”编写 字符 串 应 用 程序 


到 目前 为 止 ,你 看 到 的 字符 串 例子 都 非常 简单 ， 尽 管 它 们 对 于 阐明 特定 字符 串 函 数 工 作 
原理 是 很 有 用 的 ， 但 这 些 例 子 都 不 能 使 你 更 清晰 地 了 解 如 何 编写 一 个 有 意义 的 字符 串 处 理应 
用 。 本 节 通 过 开发 两 个 操作 字符 串 数 据 的 应 用 解决 上 述 缺 陷 。 
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3.6.1 回 文 识 别 


回 文 (palindrome) 是 指 其 字母 排列 正 序 与 倒序 均一 致 的 词语 ， 例 如 单词 “level” 
或 “noon”。 本 节 的 目的 是 编写 一 个 判断 函数 以 检测 一 个 字符 串 是 否 属 于 回 文 。 调 用 
isPalindrome ("level") 应 该 返回 true; 调用 isPalindrome ("xyz") 应 返回 false。 
和 大 多 数 编程 问题 一 样 ， 这 里 有 解决 该 问题 的 几 种 合理 策略 。 以 我 的 经 验 ， 大 部 分 学 生 
可 能 首先 尝试 的 方法 是 使 用 一 个 for 循环 依次 读 取 字 符 串 前 半 部 分 每 一 个 索引 位 置 上 的 字 
符 。 在 每 个 位 置 上 ， 代 码 将 检测 该 字符 是 否 与 出 现在 字符 串 末 尾 对 应 对 称 位 置 的 字符 匹配 。 
采取 这 种 策略 的 代码 如 下 : 
bool isPalindrome(string str) ( 
int n - str.length(); 
for (int i = 0; i <n / 2; i++) ( 
if (str[i] != str[n - i - 1]) return false; 
} 


return true; 


} 
考虑 到 使 用 本 章 遇 见 过 的 字符 串 处 理 函 数 ， 你 也 可 以 使 用 下 面 更 简洁 的 形式 编写 
isPalindrome PX: 

bool isPalindrome(string str) ( 


return str == reverse(str); 


) 

在 上 述 两 种 实现 方式 中 ， 第 一 个 版 本 更 为 有 效 。 第 二 个 版 本 必须 构造 一 个 新 的 字符 串 ， 
且 其 中 的 字符 与 原 字符 串 中 的 字符 顺序 是 相反 的 。 更 糟糕 的 是 ， 它 通过 一 次 连接 一 个 字符 的 
方式 ,创建 了 一 个 和 原 字符 串 等 长 的 临时 字符 串 。 第 一 个 版 本 不 需要 创建 任何 字符 串 。 它 通 
过 选择 和 比较 字符 串 中 的 字符 完成 其 功能 ， 这 被 证 明 是 一 种 低 代价 的 运算 。 

除了 二 者 在 效率 上 的 不 同 外 ， 第 二 种 编码 也 有 许多 优点 ， 特 别 是 对 编程 新 手 而 言 ， 可 将 
其 作为 参考 范例 。 其 主要 优点 为 : 一 方面 ， 它 通过 使 用 reverse 函数 重用 了 已 有 的 代码 ; 
另 一 方面 ， 第 一 个 版 本 需要 计算 字符 串 中 字符 的 索引 位 置 ， 而 第 二 个 版 本 则 隐藏 了 涉及 这 方 
面 的 编程 复杂 性 。 对 于 大 部 分 学 生 而 言 ， 它 至 少 要 花费 一 分 钟 或 两 分 钟 弄 明白 为 什么 代码 
要 包含 选择 表达 式 str[n - i - 1], 或 者 为 什么 它 要 在 for 循环 检验 中 使 用 < 操作 符 ， 
而 不 是 <=。 相 比 之 下 ， 以 下 这 一 行 代码 : 


return str == reverse(str); 
读 起 来 几乎 和 英语 一 样 流畅 : 如 果 一 个 字符 串 和 它 相 反 顺 序 的 字符 串 相 等 ， 则 它 是 一 个 
回 文 。 

尤其 是 当 你 正在 学 习 编程 时 ， 致 力 于 程序 的 简洁 性 比 关 注 其 执行 效率 更 为 重要 。 监 于 现 
在 计算 机 的 速度 ， 牺 牲 几 个 机 器 周期 来 使 程序 更 易于 理解 是 值得 的 。 


3.6.2 ”将 英语 翻译 成 儿童 黑 话 


为 了 使 你 更 多 地 了 解 如 何 实 现 对 字符 串 操作 的 应 用 ， 本 节 列 举 了 一 个 C++ ET, EX 
取 用 户 输入 的 一 行文 字 ， 然 后 将 这 行文 字 的 每 个 单词 从 英语 翻译 成 儿童 黑 话 (Pig Latin)， 这 
是 一 种 拼凑 的 语言 ， 世 界 上 说 英语 的 大 部 分 孩子 都 对 其 熟知 。 在 儿童 黑 话 中 ,单词 是 通过 应 
用 下 面 的 规则 从 它们 对 应 的 英语 单词 中 构造 而 成 : 
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1. 如 果 单 词 中 不 含 元 音字 母 ， 不 作 任何 翻译 ， 这 意味 着 儿童 黑 话 的 单词 和 原单 词 一 样 。 

2. 如 果 单 词 以 元 音字 母 开始 ， 则 翻译 出 的 儿童 黑 话 包括 原单 词 加 上 其 后 缀 way。 

3. 如 果 单 词 以 辅音 字母 开始 ， 提 取 辅 音字 符 子 串 直 到 遇见 第 一 个 元 音字 母 ， 移 动 收 集 的 
辅音 字母 到 单词 的 结尾 ， 然 后 添加 后 缀 ay， 这 样 就 形成 了 翻译 后 的 儿童 黑 话 。 

下 面 举例 说 明 ， 假 设 英 语 单词 是 scram， 因 为 该 单词 是 以 辅音 字母 开始 的 ， 故 可 将 它 分 
成 两 部 分 ， 一 部 分 包括 第 一 个 元 音 之 前 的 字母 ， 另 一 部 分 包括 该 元 音 和 剩余 的 字母 : 


然后 你 交换 这 两 部 分 的 位 置 并 在 末尾 添加 ay， 得 到 单词 如 下 : 


i] E [ss] 


因此 scram 的 儿童 黑 话 单词 是 amscray。 对 于 一 个 以 元 音 开 始 的 单词 ， 例 如 apple， 你 只 需 
简单 地 添加 way 到 单词 未 尾 ， 然 后 便 得 到 单词 appleway。 图 3-2 给 出 了 PigLatin 的 程 
序 代 码 。 主 程序 从 用 户 处 读 取 一 行文 本 然后 调用 LineToPigLatin 将 这 一 行 输入 翻译 成 儿 
童 黑 话 。 然 后 函数 1ineToPigLatin 调用 wordToPigLatin 将 每 个 单词 转换 成 对 应 的 儿 
童 黑 话 单词 。 不 是 该 单词 一 部 分 的 字符 被 直接 复制 到 输出 行 ， 这 样 标点 符号 和 间隔 仍 保持 不 


受 影响 。 








/* 
* File: PigLatin.cpp 
* 
This program converts lines from English to Pig Latin. 
This dialect of Pig Latin applies the following rules: 


- If the word contains no vowels, return the original 
word unchanged. 


of consonants up to the first vowel, move that set 
of consonants to the end of the word, and add "ay". 


. 1f the word begins with a vowel, add "way" to the 


* 
* 
* 
* 
* 
* 
* 2. If the word begins with a consonant, extract the set 
* 
* 
* 
* 
* end of the word. 

* 


#include <iostream> 
#include <string> 
#include <cctype> 
using namespace std; 


/* Function prototypes */ 


string lineToPigLatin(string line) ; 
string wordToPigLatin(string word) ; 
int findFirstVowel (string word); 
bool isVowel (char ch); 


/* Main program */ 


int main() { 
cout << "This program translates English to Pig Latin." << endl; 
string line; 
cout << "Enter English text: "; 
getline(cin, line); 
string translation = lineToPigLatin (line) ; 
cout << "Pig Latin output: " << translation << endl; 
return 0; 





Al 3-2 将 英语 翻译 成 儿童 黑 话 的 程序 


Function: lineToPigLatin 
Usage: string translation 


Translates each word in the line to Pig Latin, leaving all other 
characters unchanged. The variable start keeps track of the index 
position at which the current word begins. As a special case, 

the code sets start to -1 to indicate that the beginning of the 
current word has not yet been encountered. 


string lineToPigLatin(string line) ( 
string result; 
int start - -1; 
for (int i = 0; i < line.length(); i++) ( 
char ch = line[i]; 
if (isalpha(ch)) { 
if (start == -1) start = i; 
) eise ( 
if (start >= 0) { 
result += wordToPigLatin(line.substr(start, i - start)); 
start - -1; 
) 


result += ch; 


) 


if (start >= 0) result += wordToPigLatin(line.substr(start)); 
return result; 


Function: wordToPigLatin 
Usage: string translation = wordToPigLatin (word); 


Translates a word from English to Pig Latin using the rules 
specified in the text. The translated word is returned as the 
value of the function. 


string wordToPigLatin(string word) { 

int vp = findFirstVowel (word); 

if (vp == -1) ( 
return word; 

) else if (vp == 0) ( 
return word * "way"; 

} eise { 
string head - word.substr(0, vp); 
string tail = word.substr(vp); 
return tail + head + "ay"; 


Function: findFirstVowel 
Usage: int k = findFirstVowel (word); 


Returns the index position of the first vowel in word. If 
word does not contain a vowel, findFirstVowel returns -1. 


ay 


int findFirstVowel (string word) { 
for (int i = 0; i « word.length(); i++) ( 
if (isVowel(word[i])) return i; 
) 


return -1; 


Function: isVowel 
Usage: if (isVowel(ch)) 


Returns true if the character ch is a vowel. 





图 3-2 ( 续 ) 
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int findFirstVowel(string word) { 
for (int i = 0; i « word.length(); i++) { 
if (isVowel(word[i])) return i; 


return -1; 


/* 
* Function: isVowel 

* Usage: if (isVowel(ch)) . . . 
* 





* Returns true if the character ch is a vowel. 
* 


图 3-2 (4) 
上 述 示例 程序 的 运行 结果 如 下 : 










This program translates English to Pig Latin. 
Enter English text: this is pig latin. 
Pig Latin output: isthay isway igpay atinlay. 







Al 3-2 F lineToPiglatin 和 wordToPigLatin 的 代码 实现 值得 仔细 回味 。 函 数 
lineToPigLatin 在 输入 中 找到 单词 的 分 界线 ， 这 提供 了 一 种 有 用 的 模式 以 将 一 个 字符 串 
分 割 成 单个 单词 。 了 函数 wordToPigLatin 使 用 substr 提取 英语 单词 片段 ， 然 后 用 连接 
方式 将 它们 以 儿童 黑 话 的 形式 组 合 在 一 起 。 在 第 6 章 ， 你 就 会 学 到 一 个 更 通用 的 称 为 记号 扫 
Hise (token scanner) 的 机 制 ， 它 可 以 将 一 个 字符 串 分 成 逻辑 上 相连 的 多 个 部 分 。 


3.7 strlib.h 库 


” ”正如 我 多 次 在 本 书 中 所 强调 的 ， 本 章 包 含 在 库 中 的 几 个 函数 看 起 来 很 完美 。 一 旦 你 
将 这 些 函 数 应 用 到 实际 编程 中 ， 你 会 感觉 到 在 需要 实现 相同 运算 的 其 他 应 用 场合 中 不 使 用 
它们 是 很 浪费 的 。 然 而 像 wordToPigLatin 这 样 的 函数 在 其 他 地 方 不 可 能 出 现 ， 而 类 似 
toUpperCase fll startsWith 这 样 的 函数 你 会 经 常 使 用 。 因 此 为 了 避免 重 写 和 复制 粘贴 代 
码 ， 将 这 些 函 数 放 在 一 个 库 中 是 很 有 意义 的 ， 这 可 以 在 你 需要 使 用 它们 时 提供 极 大 的 便利 。 

ERPF, Stanford 类 库 包含 了 一 个 接口 ， 接 口 名 为 stzlib.h， 它 提供 了 如 表 3-3 所 
示 的 函数 。 你 可 以 在 该 表 中 看 到 若干 函数 ， 它 们 曾 在 本 章 中 定义 过 。 在 习题 中 ， 你 将 有 机 会 
补 全 包括 endswith 和 trim 在 内 的 其 他 定义 。 表 3-3 中 的 头 四 个 函数 都 与 将 数值 转换 成 
字符 串 形式 相关 ， 要 求 掌 握 的 知识 已 超出 了 你 目前 掌握 的 C++ 知识 范围 ， 但 这 只 是 暂时 的 。 
在 第 4 章 ， 你 将 学 会 如 何 使 用 一 个 新 的 数据 类 型 ， 称 作 stream 类 ， 它 能 使 这 些 函 数 的 实 
现 变 得 更 加 简单 。 


表 3-3 strlib.h 接口 提供 的 函数 


integerToString (n) 将 整数 n 转换 成 对 应 的 数字 字符 串 
stringToInteger (str) 将 数字 字符 串 str 转换 成 对 应 的 整数 
realToString (d) 将 浮 点 数 d 转换 成 对 应 的 字符 串 
stringToReal (sir) 将 实数 字符 串 str 转换 成 对 应 的 实数 值 


返回 一 个 新 字符 串 ， 字 符 串 中 的 内 容 是 将 str 中 所 有 的 小 写字 符 转 换 成 
它们 的 大 写字 符 


toUpperCase (str) 
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(AE) 
Ee (5) 返回 一 个 新 字符 串 ， 字 符 串 中 的 内 容 是 将 ste 中 所 有 的 大 写字 符 转换 成 
它们 的 小 写字 符 
equalsIgnoreCase (s, s2) 在 忽略 大 小 写 的 情况 下 ， 如 果 和 相等 ， 则 返回 true 


若 字符 串 str 以 指定 的 前 级 prefix 开始 ， 其 中 ，prefix 可 以 是 一 个 字符 
串 ， 也 可 以 是 一 个 字符 ， 则 返回 true 
endsWith (st, suffix) ca ire eat HR, JE, suffix 可 以 是 一 个 字符 串 ， 
从 参数 字符 串 str 的 开头 至 结尾 处 ， 删 除 其 中 所 有 的 空白 字符 ， 然 后 返 
回 一 个 新 的 字符 串 


startsWith (str, prefix) 


trim (str) 


本 章 小 结 


在 本 章 ， 你 已 经 学 习 了 如 何 使 用 <string> 类 库 ， 利 用 该 类 库 你 可 以 编写 出 字符 串 操 
作 函 数 ， 并 且 不 用 担心 底层 表示 的 细节 问题 。 本 章 的 重点 包括 : 

e <string> 类 库 提供 了 一 个 string 类， 它 用 于 代表 一 个 字符 序列 。 尽 管 C++ 语言 也 包 

括 一 个 更 原始 的 类 型 去 维护 对 于 C 语言 的 兼容 性 ， 但 在 编写 程序 时 最 好 使 用 string 类 。. 

e 如 果 你 使 用 >> 提取 操作 符 读 取 字 符 串 数据 ， 输 入 将 会 在 第 一 个 空白 字符 处 停止 。 如 
果 你 想 从 用 户 那 里 读 取 一 整 行 文本 ,使 用 C++ 标准 库 提供 的 getline 函数 会 更 好 。 
string 类 中 提供 的 最 常用 方法 显示 在 表 3-1 中 。 因 为 string 是 一 个 类 ,方法 都 
使 用 接收 方 语法 来 代替 传统 的 函数 形式 。 因 此 ， 为 了 获取 存储 在 scr 变量 中 字符 串 
的 长 度 ， 你 需要 调用 str.length ( )。 
string 类 提供 的 几 种 方法 破坏 性 地 修改 了 接收 字符 串 。 给 予 用 户 自由 的 权限 去 使 
用 这 些 能 够 改变 一 个 对 象 内 部 状态 的 方法 ， 这 使 得 对 象 的 完整 性 更 难以 保护 。 因 此 ， 
本 书 中 的 程序 将 最 大 限度 地 减少 这 些 方法 的 使 用 。 
string 类 使 用 操作 符 重 载 以 简化 许多 常见 的 字符 串 操作 。 对 于 字符 串 来 说 ， 最 重 
要 的 操作 符 是 + GER) 操作 符 、[] (选择 ) 操作 符 和 关系 操作 符 。 
e 循环 遍历 一 个 字符 串 中 字符 的 标准 模式 是 : 


for (int i = 0; i < str.length(); i++) { 
. . body of loop that manipulates str[i].. . 


) 
通过 连接 以 增长 一 个 字符 串 的 标准 模式 是 : 


string str = "" 
for (whatever loop header line fits the application) ( 
str += the next substring or character ; 


} 
e <cctype> 库 提供 了 几 种 处 理 单个 字符 的 函数 。 其 中 最 重要 的 函数 显示 在 表 3-2 中 。 
复习 题 


1. 字符 串 和 字符 的 区 别 是 什么 ? 
2. 判断 题 : 如 果 你 执行 以 下 代码 
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string line; 
cin »» line; 
程序 将 从 用 户 那里 读 取 一 整 行 数据 ， 然 后 将 其 存储 在 变量 line 中 。 
3.getline 函数 的 哪个 参数 是 引用 传递 的 ? 
4. 方法 和 自由 函数 之 间 的 区 别 是 什么 ? 
5. 判断 题 : 在 C++ 语言 中 ， 通 过 调用 length (str) ， 你 可 以 判断 存储 在 变量 str 中 字符 串 的 长 度 。 
6. 如 果 你 调用 sl. replace(0,1,s2) ， 哪 个 字符 串 是 接收 方 ? 
7. 当 + 操作 符 被 作用 到 两 个 字符 串 运算 对 象 时 ， 它 的 作用 是 什么 ? 
8. 当 C++ 计算 表达 式 s1«s2 时 ，string 类 使 用 什么 规则 来 比较 字符 串 值 ? 
9. 从 字符 串 中 选取 一 个 单独 字符 时 ， 本 章 描述 了 哪 两 种 语法 形式 ? 在 它们 的 实现 中 ， 这 两 种 语法 形式 
在 表示 上 有 何不 同 ? 
10. 当 你 从 C++ 字符 串 中 选取 一 个 单独 的 字符 时 ， 你 可 以 使 用 at 方法 ， 也 可 以 使 用 标准 的 下 标 操作 
符 ， 其 中 ， 索 引 是 放 在 方 括号 中 的 。 请 问 从 用 户 的 角度 看 ， 这 两 种 选择 的 区 别 是 什么 ? 
11. 判断 题 : 如 果 你 将 字符 串 变 量 sl 赋值 给 字符 串 变 量 s2, 字符 串 复制 了 字符 ,这 样 ， 一 个 字符 串 
中 字符 的 后 续 改 变 将 不 会 影响 到 另 一 个 字符 串 中 的 字符 。 
12. 判断 题 : 一 个 字符 串 中 的 索引 位 置 从 0 开始 ， 并 且 扩展 到 字符 串 的 长 度 减 1 位 置 。 
13. substr 方法 的 参数 是 什么 ?如 果 你 省 略 第 二 个 参数 ， 将 会 发 生 什么 ? 
14. 描述 compare 方法 如 何 使 用 返回 值 表示 两 个 字符 串 的 相对 顺序 。 为 什么 这 个 方法 在 实际 中 很 少 用 到 ? 
15. find 方法 返回 什么 值 来 表示 搜索 的 字符 串 没有 出 现 ? 
16. 对 于 fina 方法 ,第 二 个 可 选 参数 的 意义 是 什么 ? 
17. 假设 你 这 样 声明 和 初始 化 变量 s A t: 


string s = "ABCDE" 
= tm. 


string t 

对 于 上 述 声明 ， 下 面 每 个 调用 的 结果 是 什么 ? 

a. S. length() f. s.replace(0, 2,"z") 
b. t. length () g. s.substr (0,3) 

c. 8[2] h. s . substr (4) 

ds+t i. s. Substr (3,9) 

e.t += 'a' j. S. substr(3,3) 


18. 循环 遍历 字符 串 中 每 个 字符 这 种 程序 的 设计 模式 叫 什么 ? 

19. 如 果 你 想 从 相反 的 顺序 循环 遍历 字符 串 中 的 字符 ， 即 从 字符 串 中 的 最 后 一 个 字符 开始 至 第 一 个 字符 
结束 ， 习 题 18 中 的 模式 要 怎样 改变 ? 

20. 通过 连接 增长 一 个 字符 串 的 模式 是 什么 ? 

21. 在 «cctype» 库 中 ， 下 面 的 每 个 调用 将 产生 什么 结果 ? 


a, isdigit(7) d. toupper (7) 
b. isdigit('7') e. toupper ('A') 
c. isanum (7) f. tolower('A') 


22. 为 什么 C++ 同时 支持 string 类 和 更 原始 的 字符 串 类 型 ? 

23. 你 怎样 将 一 个 原始 的 字符 串 值 转换 成 一 个 C++ 的 字符 串 ? 你 如 何 指定 以 相反 的 方向 进行 转换 ? 

习题 

1. 实现 函数 endsWith ( stz，suffix)， 函 数 的 功能 为 : # str 以 suffix 结束 ， 则 返回 true。 类 似 
于 它 对 应 的 startswith MM, endsWith 函数 应 该 允许 第 二 个 参数 是 一 个 字符 串 或 是 一 个 字符 。 
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2. 


uU 


A 


Un 


Os 


N 


oo 


9. 


102 $3 








strlib.h 函数 提供 了 一 个 返回 新 的 字符 串 的 trim (str) 函数 ,产生 的 新 字符 串 是 通过 从 头 到 尾 
删除 str 中 的 所 有 空白 字符 形成 的 。 请 编写 对 应 的 程序 。 


.不 使 用 内 置 的 字符 串 方 法 substr， 实 现 一 个 自由 函数 substr (str, pos, n), AXOR EMA 


str 的 pos 位置 开始 ， 最 多 包含 n 个 字符 的 子 串 。 确 保 你 的 函数 正确 地 应 用 了 以 下 规则 ; 
e WE n 缺失 或 者 大 于 字符 串 的 长 度 ， 子 串 应 该 延续 到 原 字符 串 的 末尾 。 
e 如 果 pos 大 于 字符 串 的 长 度 ，substr 应 该 使 用 一 个 合适 的 消息 去 调用 error. 


.实现 一 个 返回 字符 串 的 函数 capitalize ( str)， 即 将 str 的 首 字符 转换 成 大 写 (如 果 str WAS 


符 是 一 个 字母 )， 其 他 所 有 的 字母 转换 成 小 写 的 对 应 的 字符 串 。stz 中 的 非 字 母 字 符 不 受 影响 。 例 如 ， 
capitalize ("BOOLEAN") 和 capitalize ("boolean") 两 个 都 返回 字符 串 "Boolean", 


.在 大 部 分 单词 游戏 中 ,单词 中 的 每 个 字母 是 根据 它 的 分 数值 记录 得 分 的 ， 分 数值 是 和 它 在 英语 单词 


中 的 使 用 频率 成 反比 的 。 在 Scrabble 中 ， 分 数 分 配 如 下 : 


分 数 a id 
A, E, I, LL N O, R.K S, T, U 


olujalwlrw]— 
Oly S [A] RP w]dS 
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例如 ， 在 Scrabble "P, His] "FARM" (9 94>: F 是 4 分  A 和 有 R 每 个 是 1 分  M 是 3 分。 编写 一 
个 程序 ， 在 Scrabble 中 ， 程 序 读 取 单 词 并 输出 它们 的 得 分 ， 要 求 不 计算 游戏 中 出 现 的 其 他 任何 收 
益 。 计 算 分 数 时 ， 你 应 该 忽略 除了 大 写字 母 的 任何 字符 。 特 别 是 小 写字 母 被 认为 代表 空白 ， 它 可 以 
代表 任何 字母 但 是 其 得 分 为 0。 


. 首 字母 缩 略 词 是 一 个 通过 结合 一 系列 单词 的 初始 字母 而 形成 的 单词 。 例 如 ， 单 词 “ scuba” 是 一 


个 首 字母 缩 略 词 ， 它 是 由 “ self-contained underwater breathing apparatus" ”的 第 一 个 字母 组 成 
的 。 同 理 ，AIDS 是 由 “Acquired Immune Deficiency Syndrome” 组 成 的 一 个 首 字母 缩 略 词 。 
编写 一 个 函数 acronym， 它 读 取 一 个 字符 串 ， 然 后 返回 由 该 字符 串 形 成 的 首 字母 缩 略 词 。 为 了 
确保 函数 把 有 连 字 符 的 复合 词 (如 self-contained) 看 作 是 两 个 单词 ， 它 必须 定义 一 个 单词 的 首 
字母 是 任意 的 字母 字符 ， 它 可 以 出 现在 一 个 字符 串 的 开始 位 置 ， 也 可 以 出 现在 一 个 非 字 母 字 符 
后 面 。 


. 编写 一 个 函数 : 


string removeCharacters(string str, string remove); 


该 函数 返回 一 个 string WR, str 中 的 字符 删除 remove 中 的 字符 后 构成 了 该 string 对 象 。 例 
如 ， 若 你 调用 以 下 语句 : 


removeCharacters ("counterrevolutionaries", "aeiou") 


函数 应 该 返回 "entrrvltnrs", 1Jé—^ EGG BU Er maus ps B9—4- 3 5641 8 s 


.修改 你 在 习题 7 中 的 问题 解决 方案 ， 代替 使 用 一 个 返回 新 字符 串 的 函数 ， 即 定义 一 个 


removeCharactersInPlace 函数 ， 函 数 的 作用 是 从 字符 串 中 删除 若干 字母 ， 字 符 串 是 作为 第 一 
个 参数 传人 函数 中 。 
浪费 时 间 拼 写 虚幻 的 声音 和 它们 的 历史 (也 称 为 语源 ) CREP RAB 

一 一 萧 伯 纳 ，1941 
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12. 


13. 


20 世 纪 早 期 ， 英 国 和 美国 都 有 一 个 相当 重要 的 问题 ， 即 简化 拼写 英语 单词 的 规则 ， 这 
一 直 是 一 个 难题 。 作 为 这 项 运动 的 一 部 分 ， 提 出 的 一 个 建议 是 消除 双 写 字母 ， 这 样 
bookkeeper 会 写作 bokeper, Jf H committee 会 变 成 comite。 编 写 一 个 返回 新 字符 串 的 函数 
removeDoubledLetters (str), HAMM, str 中 任何 重复 的 字符 都 被 一 个 单独 的 该 复制 
字符 所 代替 。 


. 编写 一 个 函数 : 


string replaceAll(string str, char cl, char c2); 
它 返 回 一 个 str 的 复制 字符 串 ， 其 中 str 中 每 一 个 cl 都 用 c2 代替。 例如 ， 调 用 
replaceAll("nannies", 'n', 'd'); 
应 该 返回 “daddies”。 
一 旦 你 编写 和 测试 完 这 个 函数 ,编写 一 个 重 载 的 函数 版 本 : 
string replaceAll(string str, string sl, string s2); 


该 函数 将 str 中 每 一 个 sl 字符 串 都 用 s2 FARRE. 


.通过 忽略 标点 符号 和 字母 大 小 写 的 差异 ， 回 文 的 概念 通常 被 扩展 到 整个 句子 。 例 如 以 下 句子 : 


Mádam, I'm Adam. 
这 是 一 个 回 文 的 句子 ， 因 为 如 果 你 只 看 字母 并 忽略 大 小 写字 母 的 区 别 ， 顺 序 读 和 倒序 读 是 一 
样 的 。 

编写 一 个 判断 函数 isSentencePalindrome (str)， 如 果 字 符 串 str 和 回 文句 子 的 
定义 相 匹配 ， 则 该 函数 返回 true。 你 应 该 能 够 用 该 函数 去 编写 一 个 主 程序 并 产生 以 下 的 输出 
结果 : 


This program tests for sentence 


palindromes. 
Indicate the end of the input with a blank line. 


: Not a palindrome. 
That sentence is not a palindrome. 
Enter a sentence: 





编写 一 个 函数 creatRegularPlural (word)， 请 遵循 以 下 标准 的 英语 规则 ， 函 数 返回 word 的 复数 形式 : 
a. 如 果 单 词 以 s、x、z、ch 或 sh 结尾 ， 在 单词 末尾 添加 eso 

b. 如 果 单 词 以 y 结 尾 ，y 前 面 有 一 个 辅音 ， 修 改 y 为 ies。 

c. 其 他 情况 ， 在 单词 末尾 添加 s 即 可 。 

编写 一 个 测试 程序 ， 并 设计 一 组 测试 示例 来 证 实 你 程序 能 正常 运行 。 

像 其 他 大 部 分 语言 一 样 ， 英 语 包含 两 种 类 型 的 数字 。 基 数 (cardinal number) (例如 one, two, three 
和 four) 用 在 计数 中 ， 序 数 (ordinal number) (例如 first, second, third 和 fourth) 用 来 表示 一 个 序 
列 的 位 置 。 在 本 书 中 ,序数 通 常用 数字 后 面 紧 跟 其 相应 序数 的 英语 单词 中 的 最 后 两 个 字母 来 表示 。 
因此 ， 序 数 first, second, third 和 fourth 经 常 表示 为 1st、2nd、3rd 和 4th。 然 而 ,序数 11、12 和 
13 是 11th、12th 和 13th。 设 计 一 种 规则 判断 每 个 数字 后 面 是 否 应 该 添加 后 经， 并 且 使 用 该 规则 编 
"GP createOrdinalForm (n), 该 函数 返回 一 个 作为 字符 串 出 现 的 数字 n 的 序数 形式 。 


.在 正式 文稿 (如 论文 、 报 纸 和 杂志 等 ) 中 书写 大 的 数字 时 ， 至 少 在 美国 ， 传 统 的 方式 是 用 逗号 将 数 


字 分 成 三 组 。 例 如 ， 数 字 一 百 万 通常 写成 下 面 的 形式 : 
1,000,000 
为 了 使 程序 员 更 容易 用 这 种 方式 显示 数字 ， 实 现 函 数 : 


104 PIF 


string addCommas(string digits) ; 


FH PR BE IRAE BE td EE, PREP, i A “ES I 
成 的 字符 串 。 例 如 ， 如 果 你 执行 以 下 主 程序 : 


int main() { 
while (true) ( 
string digits; 
cout «« "Enter a number: " 
getline(cin, digits); 
if (digits -- "") break; 
cout << addCommas (digits) << endl; 
) 
return 0; 


} 
addCommas 函数 的 实现 应 该 能 产生 以 下 示例 中 的 运行 结果 : 








Enter a number: 1001 


Enter a number: 12345678 
|Enter a number: 999999999 


| 999, 999,999 
| Enter a number: 


15. 图 32 中 的 PigLatin 函数 表现 的 很 奇特 ， 如 果 你 输入 一 个 字符 串 ， 该 字符 串 包 含 以 一 个 大 写字 母 开 
始 的 单词 。 例 如 ， 如 果 你 要 利用 句子 的 第 一 个 单词 和 儿童 黑 话 语言 的 名 字 ， 你 应 该 能 理解 下 面 的 输出 : 


This em En ln 1 to Pig abis. ' 
Enter English text: This is Pig Latin 
Pig Latin output: isThay isway igPay atinLay. 





EE wordToPigLatin 函数 ， 使 得 任何 一 个 以 大 写字 母 开 始 的 单词 在 儿童 黑 话 中 仍 以 一 个 大 写字 
母 开 始 。 因 此 ， 在 程序 中 做 出 必要 的 改变 后 ， 输 出 应 该 如 下 所 示 : 


This program translates English to Pig Latin. 
Enter English text: This is Pig Latin t 
Pig Latin output: Isthay isway Igpay Atinlay. v 


4 
v 
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16. 大 部 分 人 (至少 在 说 英语 的 国家 )， 在 他 们 生活 中 的 某 些 地 方 已 经 玩 过 儿童 黑 话 游戏 。 也 有 一 些 其 他 
被 发 明 的 “语言 ”使 用 一 些 英 语 的 简单 转换 创建 单词 。 其 中 一 种 这 样 的 语言 被 称 作 “ Obenglobish", 
在 这 种 语言 中 ， 通 过 在 英语 单词 的 元 音字 母 (a, e, i ofu) 前 添加 字母 ob 来 创建 单词 。 例 如， 在 
这 种 规则 下 ， 单 词 english P e 和 i 前 面 添加 字母 ob 形成 obengloish， 这 就 是 该 语言 获取 它 名 字 的 
方式 。 

在 官方 的 Obenglobish 中 ，ob 字符 只 添加 在 发 出 音 来 的 元 音字 母 前 ， 这 意味 着 一 个 像 game 的 
单词 会 变 成 gobane， 而 不 是 gobamobe， 因 为 最 后 的 e 是 不 发 音 的 。 然 而 完美 地 实现 上 述 规则 是 不 
可 能 的 ， 通 过 采用 这 样 的 规则 ， 你 可 以 完成 一 项 完美 的 工作 ， 规 则 是 在 英语 单词 中 ，ob 必须 添加 
到 每 个 元 音字 母 前 面 ， 除 了 以 下 两 级 : 
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。 在 其 他 元 音字 母后 面 的 元 音 

e 出 现在 单词 未 尾 的 e 154 
编写 一 个 函数 obenglobish, 它 读 取 一 个 英语 单词 ， 然 后 使 用 上 述 所 给 的 翻译 规则 ， 返 回 

它 等 价 的 obenglobish 单词 。 例 如 ， 如 果 你 在 主 程序 中 使 用 以 下 函数 : 


int main() { 
while (true) ( 
string word = getLine("Enter a word: "); 


if; (word == "") break; 

string trans = obenglobish (word); 

cout «« word «« " -» " «« trans «« endl; 
} 
return 0; 


} 
你 应 该 能 够 产生 下 面 的 示例 运行 结果 : 







Enter a word: hobnob 
hobnob -> hobobnobob 
Enter a word: gooiest 


Enter a word: rot 
rot -» robot 








17. 如 果 你 在 童年 玩 过 密码 ， 很 有 可 能 在 某 些 地 方 用 过 循环 码 (cyclic cipher)， 它 又 经 常 被 称 为 凯撒 密 
码 (Caesar cipher)， 因 为 罗马 历史 学 家 苏 维 托尼 乌 斯 记录 到 盖 乌 斯 * 尤 利 乌 斯 凯撒 使 用 过 这 项 技 
R, 运用 这 项 技术 你 可 以 将 原始 消息 中 的 每 个 字母 用 字母 表 中 出 现在 它 前 面 一 个 固定 距离 的 字母 来 
代 蔡 。 作 为 一 个 例子 ,假设 你 想 通过 将 每 个 字母 向 前 移动 三 个 位 置 来 编码 一 个 消息 。 运 用 这 个 密码 
技术 ， 每 个 A 变 为 D，B 变 为 E， 以 此 类 推 。 如果 你 到 达 了 字母 表 的 末尾 ， 处 理 周期 又 回 到 开头 ， 
所 以 XX 变 成 A，Y 变 成 B，Z AERC. 

为 了 实现 一 个 凯撒 密码 ， 你 首先 应 该 定义 以 下 函数 : 


string encodeCaesarCipher(string str, int shift); 


该 函数 返回 一 个 新 的 字符 串 ， 它 是 将 str 中 的 每 个 字母 转换 成 与 它 相 隔 shift 处 的 字母 形成 的 ， [155 
如 果 有 必要 ， 循 环 回 到 字母 表 的 开头 。 在 你 实现 了 encodeCaesarCipher 图 数 后 ， 编 写 程序 产 
生 以 下 示例 的 运行 结果 








This program encodes a message using a Caesar aisha. 
Enter the number of character positions to shift: 13 


|Enter a message: This is a secret message < 
| Encoded message: Guvf vf n frperg zrffntr. A 
X 


| 


l ee —— ja wt j 


注意 到 翻译 只 适用 于 字母 ， 其 他 任何 字符 都 不 经 修改 输出 。 此 外 ， 字 母 大 小 写 不 产生 影响 : 即 大 小 
写字 母 按 原 样 输出 。 你 也 应 该 这 样 编写 你 的 程序 , 一 个 负 的 shift 值 意味 着 字母 向 着 字母 表 开 头 
的 方向 进行 移动 ， 而 不 是 向 结尾 方向 ， 正 如 以 下 示例 的 运行 结果 所 表明 的 : 
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This program encodes a message using a Caesar cipher. 


Enter the number of character positions to shift: -1 
Enter a message: IEM 9000 
Encoded message: HAL 9000 





18. 尽管 它们 确实 很 简单 ， 凯 撤 密 码 也 极 容易 被 破解 。 毕 竟 ， 只 有 2S 个 字符 可 移动 。 如 果 你 想 破解 一 


个 凯撒 密码 ， 你 只 需 尝试 所 有 25 种 可 能 ， 然 后 观察 哪 一 种 翻译 能 将 原始 的 消息 转换 成 可 读 的 。 一 
个 更 好 的 策略 是 原始 消息 中 的 每 个 字母 都 被 任意 字母 代替 而 不 是 被 原始 消息 中 相隔 固定 距离 的 字符 
代替 。 这 样 的 话 ， 编 码 运算 的 关键 是 一 个 翻译 表 ， 它 展示 了 26 个 字母 中 每 一 个 改变 后 的 加 密 形式 。 
这 样 的 一 个 编码 策略 称 作 字母 替换 密码 (letter-substitution cipher) 。 

字母 替换 密码 的 关键 是 一 个 由 26 个 字符 构成 的 字符 串 ， 该 字符 串 依 次 指出 了 字母 表 中 每 个 字 
符 的 翻译 。 例 如 ， 关 键 字 “QWwERTYUIOPASDFGHJKLZXCVBNM” 表 示 编 码 过 程 应 该 使 用 下 面 的 翻 
译 规则 : 


采用 字母 蔡 换 密码 编写 一 个 能 实现 加 密 的 程序 。 该 程序 应 能 够 复制 以 下 示例 中 的 运行 结果 : 


Letter substitution cipher. 
Enter a 26-letter key: QWERTYUIOPASDFGHJKLZXCVBNM i 


Enter a message: WORKERS OF THE WORLD UNITE! 
Encoded message: VGKATKL GY ZIT VGKSR XFOZT! 





19. 使 用 前 面 习 题 中 描述 的 字母 蔡 换 密码 的 定义 ， 编 写 函 数 invertKey, 该 函数 读 取 一 个 密 钥 ,然后 


返回 经 过 加 密 后 对 应 的 解密 的 报 文 。 


20. 人 类 精神 不 能 遗传 。 


一 一 电影 GATTACA 的 标语 ，1997 

所 有 生物 的 遗传 密码 都 携带 在 它们 的 DNA (一 种 拥有 非凡 复制 自身 结构 能 力 的 分 子 ) 中 。 
DNA 分 子 的 双 螺 旋 结 构 包 含 两 条 相似 且 互 相 缠绕 的 化 学 长 链 。DNA 的 复制 能 力 来 源 于 它 的 4 种 基 
本 组 成 成 分 : 腺 苷 、 胞 喀 啶 、 乌 味 叭 和 胸腺 喀 啶 ， 它 们 只 能 通过 下 面 的 方式 互相 组 合 起 来 : 
e — RBE LM AMAA LHS RABER, RIM. 
e AR RA ARE IER, RIK. 
生物 学 家 用 首 字 母 缩写 来 表示 基本 成 分 的 名 字 : ALC. GAIT. 

在 细胞 内 部 ， 一 条 DNA 链表 现 的 像 一 个 模板 ， 其 他 DNA 链 依附 于 这 条 链 。 作 为 一 个 例子 ， 
假设 你 有 下 面 的 DNA 链 ， 其 中 每 个 基本 成 分 的 位 置 如 同 它 在 一 个 C++ 字符 串 中 一 样 用 数字 记录 。 


T A A C G G T A C G T C 


0 1 2 3 5 6 7 8 9 10 n 


在 这 道 习 题 中 ， 你 的 任务 是 判断 一 条 短 的 DNA 链 是 否 能 依附 于 这 条 长 链 上 。 例 如 ， 如 果 你 正好 找 
到 一 条 匹配 的 链 : 
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DNA 的 规则 表明 只 在 位 置 1 处 ， 这 条 链 可 以 与 长 链 结合 : 


相 比 之 下 ， 以 下 这 条 链 : 


可 以 在 位 置 2 或 位 置 7 处 与 长 链 相 匹 配 。 
编写 一 个 函数 : 
int findDNAMatch (string sl, string s2, int start = 0); 
函数 返回 DNA 链 sl Æ s2 匹配 的 第 一 个 位 置 。 正 如 string 类 中 的 find 方 法 一 样 ， 可 选择 的 
start 参数 表示 搜索 应 该 开始 的 索引 位 置 。 如 果 不 匹配 ，findDNRAMatch 应 返回 一 1。 


第 4 章 | 


Programming Abstractions in C++ 


ni 类 





我 们 将 不 会 满足 ， 除 非 正 义 像 水 及 泉水 一 样 喷涌 。 


一 一 牧师 马丁 路 德 ， 金 ,《 我 有 一 个 梦 》 1963.8.28 
(paraphrasing Amos 5:24 ) 


自从 HelloWorld 出 现在 第 1 章 起 ， 本 书 中 的 程序 已 经 使 用 了 一 种 称 为 流 (stream) 的 
重要 数据 结构 ，C++ 利用 这 种 数据 结构 管理 来 自 或 流向 某 个 数据 源 的 信息 流 。 在 前 面 的 章节 
中 ,你 已 经 使 用 了 << 和 >> HREF, 并且 有 机 会 使 用 <iostream> 库 提供 的 三 种 标准 流 : 
cin, cout Ñl cerr, 然而， 你 只 抓 住 了 你 所 能 利用 的 标准 流 功能 的 表面 。 基 于 到 目前 为 
止 你 所 见 到 的 简单 的 C++ 程序 ， 为 了 提升 编程 水 平 ， 你 必须 学 习 更 多 关于 流 的 知识 ， 并 且 
学 会 如 何 使 用 它们 创建 更 复杂 的 应 用 。 本 章 首 先 提 供 更 多 关于 << 和 >> 操作 符 的 特征 。 之 
后 介绍 数据 文件 (data file) 的 概念 ， 并 且 展 示 如 何 实现 文件 处 理 的 应 用 。 最 后 ， 本 章 通过 探讨 
C++ 流 类 的 结构 来 对 其 进行 总 结 ， 它 可 作为 面向 对 象 语言 继承 层次 的 一 个 代表 性 的 实例 。 


4.1 格式 化 输出 


在 C++ 中 , 产生 格式 化 输出 最 简单 的 方式 是 使 用 << 操作 符 。 这 个 操作 符 称 为 插入 操作 
ff (insertion operator)， 因 为 它 有 着 将 数据 插入 到 一 个 流 的 作用 。 该 操作 符 的 左 操作 数 是 输 
出 流 ; 右 操作 数 是 你 想 插 入 到 该 流 中 的 数据 。<< 操作 符 被 重 载 使 得 右 操 作 数 可 以 是 一 个 字 
符 串 或 其 他 任意 类 型 的 值 。 如 果 右 操作 数 不 是 一 个 字符 串 ， 在 将 它 发 送 给 输出 流 之 前 ，<< 
操作 符 会 将 其 转换 成 字符 串 形式 。 这 种 特性 使 得 它 更 易于 显示 变量 值 ， 因 为 C++ 能 自动 处 
理 输出 转换 。 

通过 使 用 << 操作 符 返 回流 值 ，C++ 使 得 产生 输出 更 加 方便 。 正 如 你 在 本 书 几 个 例子 中 
所 看 到 的 ， 这 种 设计 决策 使 得 将 几 个 输出 运算 连接 成 一 个 链 成 为 可 能 。 例 如 ， 假 设 你 想 在 一 
个 输出 行 中 显示 变量 total 的 值 ， 变 量 以 一 些 文本 开始 ， 目 的 是 告诉 用 户 这 个 值 代表 的 意 
义 。 在 C++ 中 ， 以 下 表达 式 : - 


cout «« "The total is " 


表示 复制 字符 串 “ The total is” 中 的 字符 到 cout 流 中 。 为 了 插入 total 值 的 十 进 制 
表示 到 流 上 ， 你 所 需要 做 的 就 是 将 变量 total 链接 到 << 操作 符 上 : 

cout «« "The total is " «« total 
这 个 表达 式 会 得 到 预期 的 结果 ， 因 为 << 操作 符 返 回流 。 因 此 ， 第 二 个 << 操作 符 的 左 操作 
数 就 是 cout ， 这 意味 着 total 的 值 会 在 输出 流 中 显示 出 来 。 最 后 ， 可 以 使 用 << 操作 符 的 
另 一 个 实例 : 通过 插入 endl 值 来 表示 这 一 输出 行 的 结束 : 


cout «« "The total is " «« total << endl; 
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即使 从 本 书 一 开始 ， 你 就 一 直 像 这 样 使 用 语句 ， 了 解 到 << 操作 符 通 过 该 表达 式 传送 
cout 值 ， 正 如 它 沿 着 插入 操作 符 链 移动 一 样 ， 将 会 帮助 你 领会 它 在 C++ 中 输出 是 如 何 工 
作 的 。 

KE endl 看 起 来 好 像 是 一 个 简单 的 字符 串 常量 ， 其 值 常常 用 来 表示 一 个 输出 行 的 结 
R, 事实 上 它 是 C++ 中 称 为 流 操纵 符 ( manipulater) 的 一 个 实例 ， 流 操纵 符 仅 是 一 种 用 于 
控制 格式 化 输出 的 一 种 特定 类 型 值 的 有 趣 名 称 。C++ 类 库 提 供 了 各 种 各 样 的 流 操 纵 符 ， 可 
以 使 用 它们 来 指定 输出 值 的 格式 ,它们 中 最 常见 的 都 显示 在 表 4-1 中 。 当 在 程序 中 包含 了 
<iostream> 库 头 文件 时 ， 这 些 流 操纵 符 的 绝 大 部 分 都 是 自动 可 用 的 。 唯 一 例外 是 读 取 参 
RTPA, 例如 set (n), setprecision (digits) 和 setfill (a). Jy f fi Hox 
些 流 操 纵 符 ， 你 还 需要 包含 <iomanip> 库 头 文件 。 

流 操纵 符 典型 的 作用 是 通过 设置 输出 流 的 属性 值 来 改变 输出 序列 的 格式 。 正 如 表 4-1 中 
逐一 列 出 的 各 条 目 所 阐明 的 那样 ， 某 些 流 操纵 符 的 作用 是 短暂 的 ( transient)， 这 意味 着 它们 
只 影响 下 一 个 输出 的 数据 值 。 然 而 ， 大 部 分 流 操作 符 的 作用 是 持久 的 ( persistent)， 这 意味 
着 其 作用 一 直 有 效 ， 直 到 它们 被 明确 地 改变 为 止 。 

关于 流 操纵 符 一 个 最 常见 的 应 用 就 是 指定 输出 域 宽度 以 支持 表格 输出 。 例 如 ， 假 设 你 想 
重 写 第 1 章 的 PowersOfTwo 程序 使 得 表格 中 的 数字 是 纵向 对 齐 的 。 为 此 ， 你 所 需要 做 的 
就 是 在 输出 语句 中 添加 合适 的 流 操纵 符 ， 如 下 所 示 : 


cout << right << setw(2) << i 
<< setw(8) «« raiseToPower(2, i) «« endl; 


表 4-1 输出 流 操纵 符 


endl 将 行 结束 序列 插入 到 输出 流 ， 并 确保 输出 的 字符 能 被 写 到 目的 地 流 中 
将 下 一 个 输出 字段 的 宽度 设置 为 n 个 字符 。 如 果 输 出 值 所 需 域 宽 小 于 DUI 
setw (n) 额外 的 空间 用 空格 填充 。 这 种 性 质 是 短暂 的 ， 这 意味 着 它 只 影响 下 一 个 插入 到 
流 中 的 数据 值 的 输出 宽度 


将 输出 流 的 精度 设置 为 digits。 精 度 说 明 的 解释 依赖 于 其 他 流 的 设置 。 如 果 

你 已 经 将 模式 设置 为 fxed 或 scientific, digits 会 指定 小 数 点 后 数字 的 位 数 。 

setprecision (digits) 如 果 没 有 设置 以 上 两 种 模式 ，digits 表示 有 效 数 字 的 位 数 ， 并 且 不 考虑 这 些 数字 
出 现在 什么 地 方 。 这 种 性 质 是 持久 的 ， 这 意味 着 它 一 直 保持 有 效 ， 直 到 它 被 明 


确 地 改变 为 止 
为 流 设置 填充 字符 cn。 默认 地 ， 如 果 需 要 额外 的 字符 填充 到 setw 设置 的 字段 
setfill (ch) 宽度 中 ， 则 空格 作为 填充 字符 输出 。 调 用 set&11 使 输出 流 可 以 改变 填充 字符 。 


例如 ， 调 用 setüll('O') 意味 着 字段 将 用 0 填充。 这 种 性 质 是 持久 的 


指定 输出 字段 为 左 对 齐 ， 这 意味 着 任何 填充 字符 都 在 输出 值 之 后 插入 。 这 种 


ER 性 质 是 持久 的 
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PE 指定 输出 字段 为 右 对 齐 ， 这 意味 着 任何 填充 字符 都 在 输出 值 之 前 插入 。 这 种 
性 质 是 持久 的 

um 指定 之 后 的 浮 点 数 输出 应 该 完整 地 呈现 ， 并 且 不 使 用 科学 计数 法 。 默 认 地 ， 
浮 点 数 应 该 以 最 简洁 的 形式 呈现 。 这 种 性 质 是 持久 的 

sciantifio 指定 之 后 的 浮 点 数 输出 应 该 以 科学 计数 法 的 形式 呈现 。 这 种 性 质 是 持久 的 

a 这 两 个 流 操纵 符 控制 浮 点 数 中 是 否 能 出 现 小 数 点 ， 这 种 控制 同样 适用 于 整数 

noshowpoint 的 情况 。 可 以 用 showpoint 强制 要 求 出 现 小 数 点 ， 然 后 通过 noshowpoint 

来 恢复 默认 设置 ， 这 种 性 质 是 持久 的 

showpos 这 两 个 流 操纵 符 控制 在 一 个 正 数 前 是 否 应 有 一 个 正 号 。 上 默认 地 ， 正 数 前 没有 

noshowpos 正 号 。 这 种 性 质 是 持久 的 

ERTA 这 两 个 流 操纵 符 控制 作为 数据 转换 的 一 部 分 所 产生 的 任意 字母 的 大 小 写 ， 例 

如 科学 计数 法 中 的 大 写字 符 E。 上 默认 地 ， 字 符 以 小 写字 母 旦 现 。 这 种 性 质 是 持 

ouppercase 久 的 
mm 这 两 个 流 操纵 符 控制 布尔 值 的 格式 ， 它 一 般 使 用 它们 内 在 的 数值 表示 呈现 。 
ep 使 用 boolalpha 流 操纵 符 导致 它们 以 true 或 false 的 形式 出 现 。 这 种 性 质 


是 持久 的 


上 述 语 句 以 宽度 为 2 的 字段 输出 i 的 值 ， 以 宽度 为 8 的 字段 输出 函数 raiseToPower( 2,i) 
的 值 。 两 个 字段 都 是 右 对 齐 的 ， 因 为 right 流 操纵 符 的 作用 是 持久 的 。 如 果 你 使 用 这 一 行 
显示 2 的 0 WEF 2 的 16 UE, 输出 显示 如 下 : 


This program lists powers of two. 
Enter exponent limit: 16 
1 


0 
1 
2 
3 
4 
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8 
9 





理解 setprecision (digits) 流 操 纵 符 的 使 用 是 复杂 的 ， 因 为 其 参数 的 解释 说 明 依 
赖 于 流 的 其 他 模式 设置 。 在 缺乏 任何 相反 的 说 明 的 情况 下 ，C++ 以 十 进 制 或 科学 计数 法 这 
些 更 简洁 的 形式 来 表示 浮 点 数 。 如 果 你 所 关心 的 是 显示 该 数值 ，C++ 允许 任意 选择 上 述 其 
中 一 种 表示 法 。 然 而 ， 如 果 你 想 更 精确 地 控制 输出 ， 你 需要 表明 你 想 要 C++ 使 用 哪 种 输 
出 格式 。fixed 流 操纵 符 指定 浮 点 值 应 该 一 直 作 为 一 个 数字 字符 串 呈现 ， 其 中 小 数 点 出 
现在 合适 的 位 置 上 。 相 反 地 ，scientific 流 操纵 符 指定 数值 应 该 一 直 使 用 科学 计数 法 的 
EREM, HH, SRE 将 指数 和 数值 分 开 。 上 述 每 一 种 格式 都 用 一 种 稍微 不 同 的 方式 来 
解释 setprecision 流 操纵 符 ， 这 使 得 它 更 难 提 供 一 种 关于 setprecision 是 如 何 工 
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作 的 简明 描述 。 
正如 在 编程 中 经 常 遇 到 的 情况 一 样 ， 要 深入 理解 库 的 更 多 细节 是 如 何 工作 的 ， 其 中 一 种 
最 好 的 方法 是 编写 简单 的 测试 程序 ， 它 会 使 你 通过 屏幕 输出 结果 看 到 流 操 纵 符 的 作用 效果 。 
图 4-1 中 的 PrecisionExample 程 序 展示 了 三 个 常量 (以 不 同 的 浮 点 模式 和 精度 呈现 ) : 
数学 常量 站 、 以 米 / 秒 为 单位 的 光速 和 描述 电气 联动 作用 的 精细 结构 常量 。 程 序 的 输出 结 
果 见 图 4-2。 163 


This program demonstrates various options for floating-point output 
by displaying three different constants (pi, the speed of light in 
meters/second, and the fine-structure constant). These constants 
are chosen because they illustrate a range of exponent scales. 


#include <iostream> 
#include <iomanip> 
#include <cmath> 
using namespace std; 


/* Constants */ 


const double PI = 3.14159265358979323846; 
const double SPEED_OF_LIGHT 2.99792458E+8; 
const double FINE STRUCTURE 7.2573525E-3; 


/* Functión prototypes */ 
void printPrecisionTable(); 
/* Main program */ 


int main() ( 
cout «« uppercase «« right; 
cout «« "Default format:" «« endl «« endl; 
printPrecisionTable(); 
cout «« endl «« "Fixed format:" «« fixed «« endl «« endl; 
printPrecisionTable(); 
cout << endl << "Scientific format:" << scientific << endl << endl; 
printPrecisionTable(); 
return 0; 


} 
/* 


* Function: printPrecisionTable 


* Generates a simple precision table for the current cout settings. 
wf 


void printPrecisionTable() ( 
cout «« " prec | pi | speed of light | fine structure" << endl; 
cout << "------ 4-------------- 十 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 十 一 一 一 一 一 一 一 一 一 一 -一 一 一 --" << endl; 
for (int prec = 0; prec <= 6; prec += 2) { 
cout << setw(4) << prec UE Ls. 
cout «« " " «« setw(12) setprecision(prec) «« PI «« " |"; 
cout «« " " «« setw(16) setprecision(prec) «« SPEED OF LIGHT «« " |"; 
cout «« " " «« setw(14) setprecision(prec) «« FINE STRUCTURE «« endl; 





图 4-1 探索 setprecision 行为 的 程序 


尽管 格式 化 输入 和 输出 〈 计 算 机 科学 家 经 常 缩写 为 TO) 机 制 在 任何 程序 设计 语言 中 都 
很 有 用 ， 但 是 它们 也 趋向 于 注重 细节 。 一 般 而 言 ， 了 解 最 常见 的 格式 化 任务 的 实现 细节 是 有 
意义 的 ， 而 对 于 不 常用 的 操作 ， 只 需 在 用 到 它们 时 再 去 了 解 。 
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prec | pi | speed of light | fine structure i 
| -4------—- i 
| 0 | 34 3E+08 | 0.007 | 
2^ 3.2 J 3E+08 | 0.0073 
| 4 | 3.142 | 2.998E+08 | 0.007257 f 
6 | 3.14159 | 2.99792E+08 | 0.00725735 $ 
| Fixed format: | 
| prec | Pi | speed of light | fine structure 
一 一 一 一 一 一 + 一 一 一 一 一 一 一 一 一 一 一 f 
0 | 3 | 299792458 | 0 H 
2 | 3.14 | 299792458.00 | 0.01 | 
| 4 | 3.1416 | 299792458.0000 | 0.0073 h 
| 6 | 3.141593 | 299792458.000000 | 0.007257 i 
| | 
[Scientific format: f 
| prec | pi | speed of light | fine structure i 
a a I 
0 | 3E+00 | 3E+08 | 7E-03 | 
A | 3.14E«*00 | 3.00E+08 | 7.26E-03 Í 
| 4 |! 3.1416E+00 | 2.9979E+08 | 7.2574E-03 | 
| 6 | 3.141593E+00 | 2.997925E+08 | 7.257352E-03 w 
= 
上 -一 -一 


图 4-2 ”说 明 浮 点 输出 的 示例 运行 结果 


4.2 格式 化 输入 


C++ 的 格式 化 输入 已 散人 入 了 流 操作 符 >>， 你 已 经 在 各 种 各 样 的 程序 中 用 到 过 它 。 这 个 
操作 符 称 为 提取 操作 符 (extraction operator)， 因 为 它 用 于 从 一 个 输入 流 中 提取 格式 化 数据 。 
到 目前 为 止 ， 你 已 经 使 用 >> 操作 符 从 控制 台 请 求 输入 数据 ， 例 如 第 1 章 中 PowersOfTwo 
程序 的 语句 行 : 


int limit; 

cout «« "Enter exponent limit: " 

cin >> limit; 

默认 地 ，>> 操作 符 在 尝试 读 取 输 入 数据 之 前 忽略 所 有 空白 字符 。 如 果 有 必要 ， 可 以 使 
用 skipws 和 noskipws 流 操纵 符 来 改变 这 种 行为 ， 它 们 显示 在 表 4-2 的 输入 流 操 纵 符 的 
列表 中 。 例 如 ， 当 你 执行 下 述 语句 时 : 


char ch; 
cout «« "Enter a single character: " 
cin >> noskipws >> ch; 


用 户 可 以 输入 一 个 空格 字符 或 制 表 符 来 响应 屏幕 提示 。 一 旦 你 省 略 了 noskipws 流 操 纵 符 ， 
程序 将 会 在 存储 ch 的 下 一 个 输入 字符 之 前 跳 过 空白 字符 。 

尽管 提取 操作 符 使 得 编写 一 个 简单 地 从 控制 台 读 取 输 入 数据 的 测试 程序 变 得 简单 ， 但 在 
实际 中 它 并 没有 广泛 采用 。>> 操作 符 的 主要 问题 是 它 几 乎 不 提供 任何 支持 检测 用 户 输入 是 
否 有 效 的 功能 。 众 所 周知 ， 用 户 在 向 计算 机 中 输入 数据 时 是 很 草率 的 。 他 们 会 造成 一 些 “ 笔 
误 ”， 或 者 更 糟糕 的 是 ， 他 们 根本 没有 理解 程序 真正 想 要 什么 输入 。 设 计 良 好 的 程序 会 检测 
用 户 的 输入 以 确保 它 形式 正确 ， 并 且 在 程序 中 是 有 意义 的 。 
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X 4-2 输入 流 操纵 符 


这 两 个 流 操纵 符 控制 提取 操作 符 >> 在 读 取 一 个 值 之 前 是 否 忽 略 空 白字 符 。 如 果 指 
定 noskipws， 提 取 操 作 符 将 所 有 的 字符 (包括 空白 字符 ) 看 作 是 输入 字段 的 一 部 分 。 
之 后 可 以 使 用 skipws 恢复 默认 的 行为 。 这 个 性 质 是 持久 的 


从 输入 流 中 读 取 字 符 ， 直 到 它 不 属于 空白 字符 。 因 此 ， 这 个 流 操纵 符 的 作用 是 跳 过 
输入 中 的 任何 空白 字符 、 制 表 符 和 换行 符 。 不 像 skipws 和 noskipws 改变 的 是 流 关 
于 之 后 的 输入 操作 行为 ，ws 流 操纵 符 是 立即 起 作用 的 


skipws 
noskipws 


ws 





遗憾 的 是 ，>> 操作 符 根本 就 不 能 胜任 检测 输入 是 否 合法 这 个 任务 ， 这 正 是 在 2.9 节 所 
介绍 的 simpio.h 库存 在 的 原因 。 如 果 你 使 用 这 个 库 提 供 的 机 制 ， 从 用 户 那里 读 取 一 个 值 
的 代码 会 从 三 行 缩减 至 以 下 一 行 : 

i int limit = getInteger ("Enter exponent limit: "); 


正如 在 第 2 章 所 提 到 的 ，getInteger 函数 同时 会 实现 内 部 的 必要 错误 检查 ， 这 使 得 
它 使 用 起 来 更 安全 。 随 后 你 将 有 机 会 理解 getInteger 是 如 何 实现 的 ， 当 你 了 解 之 后 ， 它 
看 起 来 将 不 再 神秘 。 


43 数据 文件 


当 你 想 在 计算 机 上 存储 信息 的 时 间 长 于 一 个 程序 的 运行 时 间 时 ， 通 常 的 方法 是 将 这 些 数 
据 整理 成 一 个 逻辑 整体 ， 并 将 其 作为 文件 (file) 存储 在 一 个 永久 存储 介质 上 。 通 常 ， 文 件 是 
使 用 磁 或 光 介 质 来 存储 的 ， 例 如 安装 在 计算 机 上 的 硬盘 或 一 个 可 移动 的 闪存 或 记忆 棒 中 。 然 
而 ， 介 质 的 特殊 细节 并 不 是 决定 性 的 ， 重 要 的 是 ， 你 存储 在 计算 机 上 的 永久 数据 对 象 : XX 
档 、 游 戏 、 可 执行 程序 和 源 代码 等 ， 它 们 都 是 以 文件 的 形式 存储 的 。 

在 绝 大 多 数 系统 中 ,文件 可 以 是 各 种 各 样 的 类 型 。 例 如 ， 在 编程 领域 ， 你 与 源 文件 、 目 
标 文 件 和 可 执行 文件 打交道 ， 上 述 每 一 种 文件 都 有 其 独特 的 表示 方式 。 当 你 使 用 文件 去 存储 
一 个 程序 使 用 的 数据 时 ， 文 件 通常 由 文本 构成 ， 因 此 它 也 称 为 文本 文件 〈text file)。 可 以 将 
文本 文件 视 为 一 个 字符 序列 ， 该 字符 序列 存储 在 一 个 永久 介质 中 并 以 文件 名 加 以 识别 。 文 件 
名 和 它 所 包含 的 字符 与 变量 名 和 它 的 内 容 有 相同 的 关系 。 

例如 ， 以 下 文本 文件 包含 刘易斯 . 卡 罗 尔 在 《 镜 中 奇遇 》 打 油 诗 “ Jabberwocky” 的 第 
一 节 内 容 : 

Jabberwocky .txt 
'Twas brillig, and the slithy toves 
Did gyre and gimble in the wabe; 


All mimsy were the borogoves, 
And the mome raths outgrabe. 








该 文件 名 为 vabberwocky.txt， 文 件 内 容 包含 由 诗 的 第 一 节 组 成 的 四 行 字符 。 

当 你 查看 一 个 文件 时 ， 通 常 将 它 看 作 是 一 个 二 维 结构 : 由 单个 字符 构成 的 一 系列 字符 
行 。 然 而 ， 文 本 文件 内 部 都 用 一 个 一 维 的 字符 序列 表示 。 除 了 你 能 看 到 的 输出 的 字符 之 外 ， 
文件 也 包含 一 个 换行 符 用 来 标记 每 一 行 的 结束 。 

在 很 多 方面 ， 文 本 文件 和 字符 串 是 类 似 的 。 每 一 个 文本 文件 都 由 一 个 带 有 一 个 特定 结 
束 符 的 有 序 字符 集合 组 成 。 另 一 方面 ， 字 符 串 和 文件 在 几 个 重要 的 方面 是 不 同 的 。 最 重要 的 
不 同 点 是 数据 的 持久 性 。 当 一 个 程序 运行 时 ， 字 符 串 是 临时 存储 在 计算 机 的 内 存 中 ; 而 文件 
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是 存储 在 一 个 长 期 的 存储 设备 上 ， 直 到 它 被 明确 地 删除 。 还 有 一 个 不 同 点 是 你 如 何 对 待 字符 
串 中 的 字符 与 文件 中 的 字符 。 因 为 字符 串 中 的 每 个 字符 有 一 个 索引 ， 所 以 你 可 以 简单 地 通过 
选择 索引 值 以 任意 顺序 来 处 理 字符 串 中 的 字符 。 相 反 ， 一 个 文本 文件 中 的 字符 只 能 被 顺序 处 
理 。 典 型 地 ， 处 理 文件 数据 的 程序 在 文件 的 开头 开始 ， 然 后 以 它们 的 方式 工作 (或 者 从 一 个 
输入 文件 中 读 取 已 有 的 字符 ， 或 者 向 一 个 输出 文件 写 入 新 行 )， 直 到 文件 的 结尾 。 


4.3.1 使 用 文件 流 


正如 你 将 在 4.4 节 看 到 的 ，C++ 流 库 中 的 若干 类 形成 了 一 个 层次 结构 。 为 了 帮助 你 从 整 
体 上 来 理解 该 层次 结构 ， 通 过 <fstream> 库 提供 的 两 个 流 类 ( ifstream 和 ofstream) 
开始 进行 你 的 数据 流 学 习 是 很 有 用 的 。 一 旦 你 熟悉 了 那些 例子 ， 将 很 容易 从 经 验 中 进行 概括 
和 总 结 ， 以 便 从 整体 上 理解 流 层次 。 

应 用 到 文件 流 上 最 常见 的 方法 显示 在 表 4-3 中 。 然 而 ,研究 表 4-3 不 可 能 像 学 习 几 个 处 
理 文 件 的 简单 模式 一 样 有 用 。 任 何 编程 语言 的 文件 处 理 都 趋向 于 符合 语言 习惯 ， 在 某 种 程度 
上 ， 你 需要 学 习 一 种 通用 的 处 理 策略 ， 然 后 再 将 这 个 策略 应 用 到 你 编写 的 应 用 程序 中 。 对 于 
此 规则 ，C++ 也 不 例外 。 

在 C++ 中 ， 读 或 者 写 一 个 文件 要 求 遵循 以 下 步 又; 

1. 声明 一 个 指向 某 个 文件 的 流 变 量 。 处 理 文件 的 程序 通常 为 每 一 个 活动 文件 声明 一 个 流 
变量 。 因 此 ， 如 果 你 正在 编写 一 个 读 取 输 入 文件 的 程序 ， 然 后 再 处 理 其 中 的 数据 以 产生 男 一 
个 输出 文件 ， 那 么 你 需要 声明 以 下 两 个 变量 : 


ifstream infile; 
ofstream outfile; 


2. 打开 文件 。 在 可 以 使 用 一 个 流 变 量 之 前 ， 需 要 在 所 声明 的 变量 和 一 个 实际 的 文件 间 建 立 
关联 。 该 操作 称 为 打开 (opening) 文件 ， 它 是 通过 调用 流 方 法 open 实现 的 。 例 如 ， 如 果 你 想 
读 取 包含 在 Jabberwocky.txt 文件 中 的 文本 ， 通 过 执行 以 下 方法 调用 可 以 打开 这 个 文件 : 

infile.open("Jabberwocky.txt"); 

由 于 流 库 先 于 string 类 的 介绍 ， 因 此 open 方法 将 C 风格 的 字符 串 看 作 是 文件 名 。 
于 是 ， 一 个 字符 串 字 面值 的 文件 名 是 可 接受 的 。 然 而 ， 如 果 文 件 名 存储 在 名 为 filename 的 
string 变量 中 ， 你 可 以 通过 以 下 方法 调用 打开 文件 : 


infile.open(filename. c str()); 


Xx 4-3 流 类 中 的 有 用 方法 
所 有 的 流 都 支持 的 方法 


如 果 流 处 于 失效 状态 ， 则 返回 true。 这 个 条 件 通 常 发 生 在 你 尝试 超出 文件 的 
结尾 去 读 取 数据 的 时 候 ， 但 这 也 表示 数据 中 出 现 了 一 个 完整 性 错误 


如 果 流 位 于 文件 的 结尾 ， 则 返回 true。 鉴 于 C++ 流 库 的 语义 ，eof 方法 只 
stream . eof () 用 在 一 个 fail 调用 之 后 。 此 时 ，eof 调用 允许 你 判断 故障 提示 是 否 是 由 于 到 
达 文 件 的 结尾 引起 的 


重 置 与 流 相 关 的 状态 位 。 当 一 个 故障 发 生 后 ， 无 论 何 时 需要 重新 使 用 一 个 流 ， 
都 必须 调用 这 个 函数 


判断 流 是 否 有 效 。 就 大 部 分 情况 而 言 ， 这 个 测试 和 调用 if (!stream. £ail()) 
的 效果 相同 


stream . £ail() 


stream . clear () 


if (stream) = 
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( 续 ) 
所 有 文件 流 都 支持 的 方法 


尝试 打开 文件 filemane 并 将 其 附加 到 流 中 。 流 的 方向 由 流 的 类 型 所 决定 : 输 
人流 对 于 输入 打开 ,输出 流 对 于 输出 打开 。filename 参数 是 一 个 C 风格 的 字符 
串 , 这 意味 着 你 将 需要 在 任何 C++ 字符 串 上 调用 c_str。 通过 调用 fail,， 可 
以 检测 open 方法 是 否 失败 


关闭 依附 于 流 的 文件 


stream .open (filename) 





stream . close () 
所 有 的 输入 流 都 支持 的 方法 


将 格式 化 数据 读 入 到 一 个 变量 中 。 数 据 的 格式 是 由 变量 类 型 控制 的 ， 并 且 无 
论 输 入 流 操 纵 符 是 什么 ， 它 都 是 有 效 的 


将 下 一 个 字符 读 入 到 字符 变量 var'P, var 是 引用 参数 。 返 回 值 是 流 本 身 ， 如 
果 没 有 更 多 的 字符 ， 设 置 fail 标志 

返回 流 的 下 一 个 字符 。 返 回 值 是 一 个 整数 ， 它 可 识别 以 常量 EOF 表示 文件 结 
尾 的 字符 
stream .unget () 复制 流 的 内 部 指针 以 便 最 后 读 取 的 一 个 字符 能 再 次 被 下 一 个 get 调用 读 取 


将 流 stream 中 的 下 一 行 读 和 人 到 字符 串 变 量 str 中 。getline 函数 返回 流 ， 它 
简化 了 文件 结尾 的 测试 


stream>>variable 


stream . get (var) 


stream .get () 


getline (stream, str) 


所 有 的 输出 流 都 支持 的 方法 







将 格式 化 数据 写 人 到 一 个 输出 流 。 数 据 格式 由 表达 式 的 类 型 所 控制 ， 并 且 对 
于 任何 输出 流 操纵 符 都 有 效 


将 字符 ch 写 人 到 输出 流 


stream<<expression 









stream . put (ch) 





如 果 请 求 的 文件 丢失 ， 流 会 记录 那个 错误 ， 并 且 可 调用 判定 方法 fail 去 检测 它 。 从 这 些 故 
障 中 恢复 是 你 作为 一 个 程序 员 的 责任 ， 在 本 章 的 后 面 ， 你 将 学 到 各 种 进行 故障 恢复 的 策略 。 

3. 传输 数据 。 一 旦 你 打开 了 数据 文件 ， 你 之 后 会 使 用 合适 的 流 操 作 去 实现 实际 的 IO T 
作 。 根 据 应 用 ， 可 以 选择 任意 的 传输 文件 数据 策略 。 最 简单 的 是 逐个 字符 地 读 或 写 文件 。 然 
而 ， 在 某 些 情 况 下 ， 逐 行 处 理 文件 会 更 方便 。 在 更 高 的 层面 上 ， 可 以 选择 读 或 写 格式 化 数 
据 ， 它 允许 你 将 数值 数据 与 字符 串 和 其 他 的 数据 类 型 混合 在 一 起 。 这 些 策略 的 细节 将 在 后 续 
Spp. 

4. 关闭 文件 。 当 你 结束 了 所 有 的 文件 数据 传输 后 ， 通 过 调用 流 方法 close 以 告知 文件 
系统 关闭 打开 的 文件 ， 如 下 所 示 : 


infile.close() ; 


此 操作 称 为 关闭 (closing) 文件 ， 它 切断 了 流 与 所 关联 文件 之 间 的 关系 。 


4.3.2 ”单个 字符 的 输入 / 输出 


在 许多 应 用 中 ， 处 理 文本 文件 中 数据 的 最 好 方法 是 每 次 从 文件 中 读 取 一 个 字符 。C++ 类 
库 中 的 输入 流 支 持 通过 调用 get 方法 以 支持 从 文件 中 每 次 读 取 一 个 字符 ，get 方法 有 两 种 形 
式 。 最 简单 的 策略 是 使 用 表 4-3 中 get 方法 的 第 一 种 形式 ， 它 将 来 自流 的 下 一 个 字符 保存 在 
一 个 引用 传递 的 变量 中 ,将 来 自 infile 流 的 第 一 个 字符 读 人 到 变量 ch 中 ， 如 以 下 代码 所 示 : 


char ch; 
infile.get(ch); 
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当然 ， 对 于 绝 大 多 数 应 用 ， 其 目的 并 不 是 每 次 从 文件 中 读 取 单 个 字符 ， 而 是 每 次 读 取 连 
续 的 多 个 字符 ， 就 像 你 浏览 文件 时 一 样 。 通 过 允许 流 在 有 条 件 的 背景 下 使 用 ，C++ 使 得 这 个 
操作 十 分 简单 。 读 取 一 个 文件 的 所 有 字符 的 一 般 模式 如 以 下 代码 所 示 : 

char ch; 

while (infile.get(ch)) ( 


Perform some operation on the character. 


) 
get 方法 将 下 一 个 字符 读 入 到 变量 ch 中 并 返回 流 。 相 应 地 ， 如 果 get 操作 成 功 ， 流 解释 为 
true; 否则 ， 流 解释 为 false， 这 很 可 能 是 因为 文件 中 再 没有 剩余 字符 。 因 此 ， 上 述 代码 
的 效果 是 对 读 取 的 每 个 字符 执行 一 次 while 循环 的 主体 ， 直 到 流 到 达 文 件 尾 部 为 止 。 
尽管 这 种 策略 极其 简单 ， 但 许多 C++ 程序 员 仍 使 用 返回 一 个 字符 的 get 方法 版 本 ， 很 
大 程度 上 是 因为 即使 在 过 去 的 C 语言 版 本 中 ， 这 种 策略 也 是 可 用 的 。 这 种 get 方法 的 形式 
有 以 下 原型 ; 
int get(); 
刚 开始 ， 你 可 能 觉得 函数 的 返回 结果 类 型 好 像 很 古怪 。 它 看 起 来 更 应 返回 一 个 char 类 型 的 
量 ， 但 该 原型 表明 get 方法 返回 一 个 int 类 型 的 量 。 这 种 设计 决策 的 原因 是 : 返回 一 个 字 
符 会 使 程序 更 难以 检测 到 输入 文件 的 结尾 。 由 于 char 类 型 只 有 256 种 可 能 的 字符 代码 ， 一 
个 数据 文件 可 能 包含 这 些 值 中 的 任何 一 个 。 不 存在 这 样 的 值 (或 至 少 不 存 在 这 样 的 char 类 
型 值 )， 让 你 可 以 使 用 它 作为 表示 文件 结束 条 件 的 信号 量 。 定 义 get 返回 一 个 整数 意味 着 函 
数 可 以 返回 合法 字符 代码 范围 之 外 的 一 个 值 来 表示 文件 结束 的 条 件 。 该 值 的 符号 名 为 EOF. 
如 果 你 使 用 这 种 形式 的 get 方法 ， 那 么 逐个 字符 地 读 取 一 个 完整 文件 的 代码 模式 应 该 
如 下 所 示 : 
while (true) { 
int ch = infile.get(); 
if (ch == EOF) break; 


Perform some operation on the character. 


} 


代码 的 实现 使 用 了 读 直 到 信号 量 的 模式 ， 这 种 模式 在 第 1 章 的 addList 程序 中 已 做 了 介 
绍 。while 循环 的 主体 部 分 将 下 一 个 字符 读 入 到 整 型 变量 ch 中 ， 如 果 ch 是 文件 结束 信号 
量 ， 则 退出 循环 。 

然而 ,许多 C++ 程序 员 使 用 下 面 稍 短 但 明显 更 有 意义 的 形式 来 实现 这 个 循环 : 

int ch; 

while ((ch = infile.get()) != EOF) { 


Perform some operation on the character. 


} 
在 这 种 形式 的 代码 中 ，while (APRI E dU des EH] FAK TRE, BI cise 
符 然后 再 测试 它 是 否 为 文件 结束 条 件 。 当 C++ 计算 这 个 测试 时 ， 首 先 计算 子 表达 式 : 


ch = infile.get() 
这 个 表达 式 读 取 一 个 字符 并 将 它 赋 给 变量 ch。 在 执行 循环 主体 之 前 ， 程 序 要 继续 确保 赋值 
结果 不 是 BOF。 赋 值 语句 周围 的 圆 括号 是 必需 的 ; 没有 它们 ， 表 达 式 会 错误 地 将 字符 与 EOF 
的 比较 结果 赋 给 ch。 因 为 这 种 语言 风格 会 频繁 地 出 现在 现存 的 C++ 代码 中 ， 当 它 出 现时 ， 
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你 需要 识别 并 理解 它 。 在 你 自己 的 代码 中 ,更 容易 基于 get 方法 的 引用 调用 版 本 来 使 用 这 


种 更 简单 的 语言 风格 。 
对 于 输出 流 ，put 方法 以 一 个 char 类 型 的 值 为 其 参数 ， 然 后 将 字符 写 入 到 输出 流 中 。 
因此 ， 一 个 典型 的 put 方法 调用 如 下 所 示 : 


outfile.put(ch); 


作为 一 个 get 和 put 方法 的 使 用 实例 ， 图 4-3 中 的 ShowFileContents 程序 在 控制 
台 上 展示 了 一 个 文本 文件 的 内 容 。 假 设 存 在 Jabberwocky .txt 文件 ， 这 个 程序 的 示例 运 
行 结果 如 下 所 示 : 






“Input file: JahberwocHy txt 
‘Twas brillig, and the slithy towns 





图 4-3 中 的 代码 也 包含 了 函数 promptUserForFile， 它 要 求 用 户 输 入 一 个 文 
件 名 ， 然 后 打开 该 文件 作为 输入 。 pe dde PUR BOR EET 76. 则 
promptUserForFile 要 求 用 户 输入 一 个 新 的 文件 名 ， 持 续 这 个 过 程 直到 open 调用 成 功 
为 止 。 当 用 户 输入 一 个 不 合法 的 文件 名 时 ， 这 种 设计 允许 程序 能 优雅 地 恢复 。 例 如 ， 如 果 用 
户 第 一 次 忘记 包含 .txt 扩展 名 ， 控 制 台 最 开始 几 行 输出 如 下 所 示 : 









|Input file: jabberwocky 
Unable to open that file. Try again. 
Input file: jabberwocky.txt 


| 


/* 
* File: ShowFileContents.cpp 
* 


* This program displays the contents of a file chosen by the user. 
“/ 

#include <iostream> 

#include <fstream> 

#include <string> 

using namespace std; 

/* Function prototypes */ 

string promptUserForFile(ifstream & infile, string prompt = ""); 

/* Main program */ 


int main() { 
ifstream infile; 


promptUserForFile(infile, “Input file: "); 
char ch; 
while (infile.get(ch)) { 
cout . put (ch) ; 
) 
infile.close(); 
return 0; 





图 4-3 ”展示 一 个 文件 内 容 的 程序 
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/* 

* Function: promptUserForFile 

* Usage: string filename = promptUserForFile(infile, prompt); 
* 


* Asks the user for the name of an input file and opens the reference 
* parameter infile using that name, which is returned as the result of 
* the function. If the requested file does not exist, the user is 

* given additional chances to enter a valid file name. The optional 

* prompt argument is used to give the user more information about the 
* desired input file. 


*/ 


string promptUserForFile(ifstream & infile, string prompt) ( 
while (true) 
cout «« prompt; 
string filename; 
getline(cin, filename); 
infile.open(filename.c str()); 
if (linfile.fail()) return filename; 
infile.clear(); 
cout «« "Unable to open that file. Try again." «« endl; 
if (prompt -- "") prompt - "Input file: "; 





图 4-3 (4%) 


尽管 promptUserForFile 函数 实现 背后 的 逻辑 很 容易 学 习 ， 但 仍 有 几 个 重要 的 细节 
值得 提 及 。 例 如 ，open 调用 需要 使 用 c str 将 存储 在 filename 中 的 C++ 字 符 串 转换 为 
流 库 要 求 的 旧 风 格 的 C 字符 串 。 类 似 地 ， 需 要 在 while 循环 体内 的 调用 clear 来 确保 在 
用 户 输入 一 个 新 的 文件 名 之 前 ， 流 中 的 故障 状态 标志 被 重 置 。 

当 你 从 一 个 输入 文件 中 读 取 字符 数据 时 ， 有 些 你 会 发 现 你 处 于 这 样 一 个 尴 众 位 置 : 你 不 
知道 何 时 应 停止 读 取 字 符 ， 直 到 你 已 经 读 取 到 了 超过 你 所 需要 的 字符 。 例 如 ， 考 虑 一 下 ， 当 
C++ 提取 操作 符 尝试 读 取 一 个 整数 时 ,会 发 生 什么 ,这 个 整数 是 用 十 进 制 数 的 字符 串 表 示 
的 。 直 到 库 实 现 函 数 读 取 一 个 不 是 数字 的 字符 时 ， 它 才 知 道 输入 数据 结束 。 然 而 ， 那 个 字符 
可 能 是 一 些 随后 输入 的 一 部 分 ， 因 此 ， 不 能 丢失 信息 是 至 关 重 要 的 。 

通过 提供 一 个 名 为 unget 的 方法 ，C++ 解决 了 这 个 关于 输入 流 的 问题 ， 该 方法 具有 以 
FÉR: 


infile.unget(); 


这 个 调用 的 作用 是 将 大 部 分 最 近 的 字符 “推送 ” 回 到 输入 流 中 ， 以 便 它 在 下 一 个 get 调用 
中 返回 。C++ 库 的 规格 说 明 保证 了 它 总 是 可 以 将 一 个 字符 推送 回 到 输入 文件 中 ,但 是 你 不 应 
该 依赖 能 够 预先 读 取 几 个 字符 并 且 将 它们 全 部 推 回 。 幸 运 的 是 ,在 绝 大 部 分 情况 下 ， 能 够 扒 
送 回 一 个 字符 已 经 足够 了 。 


4.3.3 面向 行 的 输入 /输出 


因为 文件 通常 细 分 为 单独 的 行 ， 所 以 每 次 读 取 一 整 行 数据 常常 是 很 有 用 的 。 实 现 这 种 操 
作 的 流 函 数 为 getline， 尽 管 它 和 来 自 simpio.h 头 文件 的 getline 函数 有 着 类 似 的 功 
能 ,但 两 者 是 不 一 样 的 。getline MM (作为 一 个 自由 函数 而 不 是 类 中 的 方法 ) 有 两 个 引 
用 参数 : 从 中 读 取 数据 行 的 输入 流 和 向 其 写 入 结果 的 一 个 字符 串 变 量 。 函 数 调 用 如 下 : 


getline (infile, str); 


将 文件 infile 的 下 一 行 复制 到 变量 str 中 ， 直 到 (但 不 包括 ) 读 和 人 标记 行 结尾 的 换行 符 为 
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ik. KW get WH, getline 函数 返回 输入 流 ， 这 使 得 它 很 容易 判断 文件 结束 条 件 。 你 所 
需要 做 的 是 将 getline 调用 本 身 作 为 一 个 测试 表达 式 来 使 用 。 

getline 函数 使 得 重 写 ShowFileContents 程序 成 为 可 能 ， 这 样 该 程序 可 以 每 次 从 
文件 中 读 取 一 行 。 如 果 你 采取 这 种 方法 ， 主 程序 中 的 while 循环 将 如 下 所 示 : 

string line; 

while (getline(infile, line)) ( 


cout «« line «« endl; 
} 


while 循环 将 infile 文件 中 的 每 一 行 数据 读 入 到 string 变量 line 中 ， 直 到 流 到 达 文 件 
的 结尾 。 循 环 体 中 使 用 << 操作 符 将 每 行 数据 Line 发 送 给 cout, ， 后 面 加 一 个 换行 符 。 


4.3.4 格式 化 输入 / 输出 


除了 逐个 字符 处 理 文件 和 逐 行 处 理 文件 的 方法 外 ， 也 可 以 在 文件 流 上 使 用 << 和 >> 
操作 符 ， 正 如 你 已 经 在 控制 台 流 上 使 用 过 的 一 样 。 例 如 ， 假 设 你 想 修改 图 1-5 所 示 的 
AddIntegerList 程序 ， 使 其 能 够 从 一 个 数据 文件 而 不 是 控制 台 获 取 输 入 。 最 简单 的 方法 
就 是 打开 一 个 用 于 输入 的 数据 文件 ,使 用 ifstream 代替 cin 去 读 取 输入 值 。 

在 程序 代码 中 ， 你 仅 需要 做 的 一 个 改变 是 当 输入 结束 时 退出 循环 。 控 制 台 版 本 的 程序 
使 用 了 一 个 信号 量 值 来 表示 输入 的 结束 。 对 于 从 文件 中 读 取 输 入 数据 的 程序 版 本 而 言 ， 循 环 应 
该 持续 到 没有 更 多 的 数据 值 可 以 读 取 为 止 。 判 断 该 条 件 最 简单 的 方法 是 使 用 >> 操作 符 。 因 为 
>> 返回 这 个 输入 流 ， 所 以 它 通过 设置 fail 标志 表示 文件 结束 条 件 ，C++ 将 其 解释 为 falses 

如 果 你 在 原始 代码 中 做 了 这 些 改变 ， 则 程序 如 下 所 示 : 

int main() { 

ifstream infile; 
promptUserForFile(infile, "Input file: "); 
int total - 0; 
int value; 
while (infile »» value) ( 
total += value; 
} 
infile.close() ; 
cout << "The sum is " << total << endl; 


return 0; 


} 

遗憾 的 是 ， 尽 管 从 技术 角度 来 说 这 种 实现 策略 是 正确 的 ， 但 不 够 完美 。 如 果 所 有 的 数据 
都 用 正确 的 方式 格式 化 ， 程 序 将 返回 正确 的 答案 。 然 而 ， 如 果 文 件 中 有 无 关 字符 ， 那 么 在 读 
取 完 所 有 的 输入 数据 之 前 循环 就 会 退出 。 更 糟糕 的 是 ， 程 序 不 会 给 出 错误 发 生 的 提示 。 

问题 的 核心 是 表达 式 中 的 提取 操作 符 : 

infile >> value; 
这 将 在 下 述 两 种 情况 中 的 任意 一 种 发 生 时 设置 故障 提示 器 : 

1. 到 达 文 件 的 结尾 ， 该 处 已 没有 更 多 的 数据 可 供 读 取 。 

2. 试图 从 文件 中 读 取 不 能 转化 为 整数 的 数据 。 
通过 检查 当 循环 退出 时 文件 是 否 已 到 达 结 尾 ， 可 以 区 分 上 述 两 种 情况 。 例 如 ， 可 以 在 
while 循环 后 添加 下 面 一 行 代码 ， 以 使 用 户 得 知 数据 错误 是 否 发 生 : 
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if ('infile.eof()) { 
error("Data error in file"); 


} 


关于 错误 的 根源 ， 该 错误 提示 并 没有 给 用 户 提供 太 多 的 指导 ， 但 至 少 它 比 什么 都 没有 要 好 。 

男 一 个 问题 是 就 提取 操作 符 所 允许 的 数据 格式 而 言 ， 它 过 于 自由 。 除 非 你 已 经 指定 ， 否 
WW, >> 操作 符 将 所 有 空白 字符 序列 作为 数据 分 隔 符 接受 。 这 样 ， 输 入 文件 不 需要 每 一 行 只 
包含 一 个 值 ， 取 而 代 之 的 是 ， 可 以 用 许多 方法 进行 格式 化 。 例 如 ， 你 想 使 用 你 的 应 用 添加 开 
始 的 五 个 整数 ， 你 不 需要 在 每 一 行 只 输入 一 个 数据 ， 如 下 面 的 数据 文件 所 示 : 


WD OP 


将 所 有 的 值 放 在 单独 的 一 行 也 能 够 很 好 地 工作 ， 并 且 在 实际 中 ， 它 可 能 更 方便 。 如 下 所 示 : 


1 2 3 4 5 


拥有 如 此 大 的 灵活 性 所 带 来 的 问题 是 : 更 难 发 现 某 些 种 类 的 格式 化 错误 。 例 如 ， 如 果 你 
偶然 地 在 一 个 整数 中 添加 一 个 空格 ， 将 会 发 生 什 么 ? 就 目前 情况 看 ，sumIntegerFile 应 
用 会 简单 地 将 空格 前 后 的 两 个 数字 读 作 是 两 个 分 开 的 值 。 在 这 种 情况 下 ， 坚 持 严 格 的 格式 化 
规则 对 于 保持 数据 完整 性 显得 更 好 。 

在 SumIntegerFile 应 用 中 ， 正 如 第 一 个 示例 文件 一 样 ， 坚 持 每 一 行 只 出 现 一 个 数据 
值 是 有 意义 的 。 遗 憾 的 是 ， 如 果 你 拥有 的 唯一 工具 是 文件 流 和 提取 操作 符 ， 强 制约 束 是 很 困 
难 的 。 开 始 的 一 种 方法 是 以 每 次 一 行 来 读 取 数据 文件 ， 然 后 在 添加 到 整体 之 前 将 每 一 行 转换 
成 一 个 整数 。 如 果 你 要 采用 这 种 方法 ， 主 程序 将 如 下 所 示 : 


int main() { 
ifstream infile; 
promptUserForFile(infile, "Input file: "); 
int total = 0; 
string line; 
while (getline(infile, line)) ( 
total += stringToInteger(line); 
} 
infile.close(); 
cout «« "The sum is " «« total «« endl; 
return 0; 


} 


唯一 省 略 的 内 容 是 stringToInteger 函数 的 实现 。 

尽管 C++ 库 包含 一 个 名 为 atoi 的 函数 ， 它 能 将 字符 串 转 换 成 一 个 整数 ， 但 是 由 于 该 
函数 是 在 «string» 类 库 之 前 出 现 的 ， 因 此 ， 它 要 求 使 用 C 字符 串 ，C 字符 串 使 用 起 来 更 
不 方便 。 如 果 你 能 找到 一 种 方法 实现 该 转换 ， 同 时 在 C++ 中 又 保持 数据 完整 性 ， 这 将 是 非 
常 棒 的 事 。 你 知道 C++ 库 必须 包含 必要 的 代码 ， 因 为 当 >> 操作 符 从 文件 中 读 取 一 个 整数 
时 ， 它 必须 实现 转换 。 如 果 有 一 种 方法 能 使 用 相同 的 代码 从 字符 串 中 读 取 整 数 ， 那 么 函数 
stringToInteger 的 实现 将 很 快 得 出 结果 。 正 如 你 将 在 后 续 章 节 所 学 到 的 ，C++ 流 库 正 
好 提供 了 那 种 功能 ， 它 被 证 明 在 多 种 多 样 的 应 用 中 是 很 有 用 的 。 
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鉴于 文件 和 字符 串 都 是 字符 序列 ,很 自然 地 想到 程序 语言 可 能 允许 你 同等 地 对 待 它们 。 
C++ f£ <sstream> 库 中 提供 了 这 种 能 力 ，<sstream> 库 提供 了 几 种 类 允许 你 将 一 个 流 和 
一 个 字符 串 值 关 联 起 来 ， 所 使 用 的 方法 和 <fstream> 库 允 许 你 将 一 个 流 和 一 个 文件 关联 起 
来 的 方法 是 很 相像 的 。istringstream 类 与 ifstream 相 似 ， 它 使 你 可 以 使 用 流 操 作 符 
从 字符 串 中 读 取 数据 。 就 输出 而 言 ，ostringstream 类 除了 期 望 是 一 个 字符 串 而 不 是 一 
个 文件 之 外 , 它 与 ofstream 类 的 功能 非常 像 。 
istringstream 类 的 存在 使 得 你 可 以 实现 stringToInteger 方法 ， 它 在 最 后 一 节 
中 会 有 描述 ， 如 下 所 示 : 
int stringToInteger (string str) { 
istringstream stream(str); 
int value; 
stream >> value >> ws; 
if (stream.fail() || !stream.eof()) { 


error ("stringToInteger: Illegal integer format"); 


} 


return value; 


} 
函数 的 第 一 行 介绍 了 变量 声明 的 一 种 重要 特征 ， 这 是 你 以 前 没 见 过 的 。 如 果 你 正在 声明 一 个 
WA, WA C++ 允许 你 在 变量 名 后 添加 参数 来 控制 对 象 的 初始 化 。 在 这 个 实现 中 ， 以 下 行 : 
istringstream stream(str); 


声明 了 一 个 名 为 stream 的 变量 ， 并 且 将 其 初始 化 为 一 个 istringstream 对 象 ， 该 对 象 
已 经 建立 ， 用 于 从 字符 串 变 量 str 中 读 取 数据 。 之 后 两 行 如 下 所 示 


int value; 
stream >> value >> ws; 


这 两 行 代码 从 流 中 读 取 一 个 整数 值 并 将 其 存储 在 变量 value 中 。 在 这 个 实现 中 ， 空 白字 符 
允许 出 现在 值 前 面 或 后 面 。 第 一 个 >> 操作 符 会 自动 地 跳 过 任何 出 现在 值 前 面 的 空白 字符 。 
位 于 行 结尾 的 ws 流 操纵 符 会 读 取 任 何 出 现在 值 后 面 的 空白 字符 ， 因 此 ， 它 确保 了 : 如 果 输 
入 能 正确 地 初始 化 ， 流 的 位 置 也 是 正确 的 。 以 下 几 行 语句 会 检查 确保 输入 合法 : 

if (stream.fail() || 'stream.eof()) ( 


error("stringToInteger: Illegal integer format"); 


) 


如 果 字 符 串 不 能 作为 一 个 整数 解析 ,stream.fail( ) 将 会 返回 true， 从 而 触发 错误 消息 。 
然而 ， 如 果 字 符 串 是 以 数字 开始 但 是 却 包含 另外 的 字符 ，stream.eof ( ) 将 会 是 false， 
它 也 会 触发 错误 消息 。 
如 果 你 需要 向 另 一 个 方向 转化 ， 可 以 使 用 ostringstream 类 。 例 如， 下 面 的 函数 将 
一 个 整数 转化 为 十 进 制 数 字 字 符 串 : 
string integerToString(int n) ( 
ostringstream stream; 
stream << n; 


return stream.str(); 


) 
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第 二 行 的 << 操作 符 将 值 转化 为 它 的 十 进 制 表示 形式 ， 正 如 它 在 文件 中 的 作用 一 样 。 然 而 ， 
在 这 种 情况 下 ,输出 指向 的 是 一 个 字符 串 ， 该 字符 串 是 作为 ostringstream 对 象 的 一 一 部 分 
内 部 存储 的 。return 语句 中 的 scr 函数 复制 了 内 部 字符 串 的 值 ， 使 得 它 可 以 返回 给 调用 者 。 
注意 到 一 个 有 趣 的 事实 : 这 个 方向 的 转化 实质 上 更 容易 ， 因 为 它 不 再 需要 考虑 格式 化 错误 。 


4.3.6 ”一 个 用 于 控制 台 输 入 的 更 鲁 棒 的 策略 

对 于 检测 用 户 输入 的 格式 是 否 正确 的 问题 ， 字 符 串 流 也 提供 了 一 个 解决 方法 。 正 如 
4.3.4 节 讨 论 的 ，>> 操作 符 不 检查 用 户 的 输入 错误 。 例 如 ， 如 果 你 要 求 用 户 输入 一 个 整数 值 ， 
并 且 要 使 用 来 自 PowersOfTwo 程序 的 如 下 语句 ， 考 虑 一 下 ， 将 会 发 生 什 么 : 

int limit; 

cout «« "Enter exponent limit: " 

cin »» limit; 
如 果 用 户 输入 一 个 有 效 的 整数 ， 一 切 都 顺利 。 但 是 如 果 用 户 在 尝试 输入 值 16 时 ， 手 却 滑 到 
了 键盘 的 下 一 行 ， 并且 录入 了 字符 t 而 不 是 数字 6， 将 会 发 生 什 么 ? 在 一 个 理想 的 世界 里 ， 
程序 将 视 输 入 为 it， 并 且 抱 怨 输入 的 有 效 性 。 遗 憾 的 是 ， 如 果 你 在 C++ 中 使 用 提取 操作 
符 ， 该 错误 将 不 会 被 发 现 。 当 要 求 程序 将 一 个 值 读 人 整 型 变量 limit 时 ，>> 操作 符 会 读 取 
字符 直到 它 在 整数 字段 中 发 现 一 个 不 合法 的 字符 。 因 此 ， 输 入 在 上 处 停止 ， 但 是 值 1 仍 是 一 
个 合法 的 整数 ， 所 以 程序 继续 正确 运行 ，Limit 等 于 1。 

确保 用 户 输入 是 有 效 的 ， 最 有 效 的 方法 是 将 一 整 行 作为 一 个 字符 串 读 取 ， 然 后 将 该 字 
符 串 转化 成 一 个 整数 。 这 个 策略 收录 在 图 4-4 所 示 的 函数 getInteger 中 。 正 如 >> 操 
作 符 所 做 的 那样 ， 这 个 函数 从 用 户 处 读 取 一 个 整数 ,但 它 同 时 也 确保 整数 是 有 效 的 。 函 数 
getInteger 的 用 法 和 前 面 章 节 中 的 stringToInteger 困 数 相似 。 主 要 的 不 同 点 仅 是 
getInteger 4 给 予 用 户 一 次 重新 输入 正确 值 的 机 会 ， 而 不 是 以 一 条 错误 消息 来 结束 程序 ， 
如 下 面 运 行 的 例子 所 示 : 








This program lists powers of two. 

Enter exponent limit: 1t 

Illegal integer | £g again. iW 
Enter exponent limit al 


I 


正如 这 个 例子 所 解释 的 ，getInteger 在 第 一 行 发 现 了 录 人 错误 ， 然 后 要 求 用 户 重新 输入 一 
个 新 值 。 当 用 户 重 新 正确 地 输入 值 16 并 按 回 车 键 后 , getInteger 将 这 个 值 返回 给 调用 者 。 





/* 
* Function: getInteger 
* ` Usage: int n = getInteger (prompt) ; 


* Requests an integer value from the user. The function begins by 
* printing the prompt string on the console and then waits for the 
* user to enter a line of input data. If that line contains a 

* single integer, the function returns the corresponding integer 

* value. If the input is not a legal integer or if extraneous 

* characters (other than whitespace) appear on the input line, 





* the implementation gives the user a chance to reenter the value. 
*/ 


图 4-4 ”从 控制 台中 读 取 一 个 整数 的 函数 


流 x 123 





int getInteger(string prompt) ( 

int value; 

string line; 

while (true) ( 
cout «« prompt; 
getline(cin, line); 
istringstream stream(line); 
stream >> value >> ws; 
if (!stream.fail() && stream.eof()) break; 


cout «« "Illegal integer format. Try again." «« endl; 


xeturn value; 


) 





图 4-4 (£X) 


正如 你 在 图 4-4 代码 中 所 看 到 的 ，getInteger 困 数 有 一 个 提示 字符 串 ， 在 函数 读 取 
输入 行 数 据 时 ， 它 显示 给 用 户 。 这 种 设计 决策 直接 遵循 一 个 事实 ， 即 如 果 一 个 错误 发 生 了 ， 
getInteger 函数 需要 这 样 的 信息 来 重复 提示 字符 串 。 

对 于 读 取 整 数 数据 ，getInteger 函数 是 一 个 比 >> 操作 符 更 值得 信赖 的 工具 。 因 此 在 
要 求 检查 错误 的 应 用 中 使 用 getInteger 代替 >> 操作 符 是 有 意义 的 。 正 如 你 已 经 从 第 2 
章 学 到 的 ，getInteger 是 作为 simpio 库 的 一 部 分 包含 在 Stanford 库 中 的 。 

44 类 层次 

当 C++ 的 设计 者 承担 着 使 输入 /输出 库 现 代 化 的 任务 时 ， 他 们 选择 采用 一 种 面向 对 象 的 
方法 。 这 种 决策 的 含义 是 流 库 中 的 数据 类 型 是 作为 类 实现 的 。 相 比 于 旧 的 表示 数据 的 方法 ， 
类 有 许多 的 人 优势。 其中， 最 重要 的 是 ， 类 提供 了 封装 (encapsulation) 的 框架 ,将 数据 表示 
和 与 其 相关 的 操作 组 合成 一 个 一 致 的 整体 的 过 程 称 为 封装 ， 这 个 整体 应 尽 可 能 少 地 揭示 底层 
结构 的 细节 。 本 章 中 你 所 看 到 的 类 已 很 好 地 展示 了 封装 的 概念 ， 当 你 使 用 这 些 类 时 ， 你 不 知 
道 它 们 是 如 何 实现 的 。 作 为 一 个 用 户 ， 你 所 需要 知道 的 是 什么 方法 是 可 用 的 ， 以 及 怎样 调用 
它们 。 

除了 封装 之 外 ， 面 向 对 象 程序 提供 了 另外 的 重要 优势 。 特 别 地 ， 面 向 对 象 语言 中 的 类 
形成 了 一 个 层次 ， 其 中 ， 每 一 个 类 自动 地 获取 上 面 一 个 层次 的 类 的 特征 。 这 种 属性 称 为 继承 
(inheritance)。 相 对 于 其 他 许多 面向 对 象 语言 ， 尽 管 C++ 趋向 于 较 少 地 使 用 继承 ， 然 而 它 仍 
是 一 个 使 面向 对 象 模式 区 别 于 早期 程序 模型 的 特征 。 


4.4.1 生物 层次 


一 种 面向 对 象 语言 的 类 层次 结构 在 很 多 方面 和 生物 分 类 系统 是 类 似 的 ， 它 是 由 18 世纪 
瑞典 植物 学 家 卡尔 : 18 + 林 奈 提出 的 ， 作 为 一 种 表示 生物 世界 结构 的 方法 。 在 林 奈 的 概念 
中 ,生物 首先 细 分 为 界 (kingdom)。 原 始 的 系统 只 包含 植物 界 和 动物 界 ， 但 是 有 一 些 形式 的 
生命 〈 例 如 真菌 和 细菌 ) 不 属于 任何 一 个 种 类 ， 并 且 现 在 有 了 它们 自己 的 界 。 然 后 每 个 界 进 
一 步 分 解 成 包括 门 、 纲 、 目 、 科 、 属 和 种 的 分 层 种 类 。 每 个 属于 底层 的 生物 物种 同时 也 属于 
每 个 较 高 层次 的 某 些 种 类 。 

生物 分 类 系统 如 图 4-5 所 示 ， 它 展示 了 常见 的 黑色 花园 蚂蚁 的 分 类 ， 该 蚂 蚊 有 一 个 对 
应 于 它 的 属 和 种 的 学 名 Lasius niger。 然 而 这 种 蚂蚁 也 是 蚁 科 的 一 部 分 ， 蚁 科 实 际 上 是 鉴 
别 蚂蚁 的 一 种 分 类 。 如 果 你 在 层次 结构 中 从 那儿 向 上 行动 ， 你 会 发 现 Lasius niger 也 属于 
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RAH (GREHE) ERX (由 昆虫 组 成 ) 和 节肢 动物 门 〈 例 如 ， 包 括 贝 类 和 蜘蛛 )。 





on 


根据 黑色 花园 蚂蚁 的 属 和 物 


每 个 在 生物 层次 上 的 类 都 继承 
种 ， 它 被 分 类 为 Lasius niger. 了 之 上 的 类 的 特征 。 例 如 ， 由 
它 也 是 深 色 标记 的 链 上 每 一 于 蚂蚁 是 昆虫 类 的 子 类 ， 并且 
个 类 的 成 员 所 有 的 昆虫 都 有 六 条 腿 ， 所 以 


一 只 黑色 花园 蚂蚁 有 六 条 腿 
图 4-5 生物 世界 的 类 层次 


一 种 使 这 种 生物 分 类 系统 很 有 用 的 属性 是 所 有 的 生物 都 属于 该 层次 中 每 一 层 的 一 个 类 
别 。 因 此 ， 每 一 个 单独 的 生命 形式 同时 属于 几 个 种 类 ， 并且 继承 了 每 一 个 类 的 属性 。 例 如 ， 
物种 Lasius niger 同时 是 一 只 蚂蚁 、 一 只 昆虫 、 一 个 节肢 动物 和 一 个 动物 。 每 只 蚂蚁 拥有 人 它 
自 那 些 种 类 继承 的 属性 。 一 种 用 于 定义 昆虫 类 的 特征 是 昆 由 有 六 条 腿 。 因 此 ， 所 有 的 蚂蚁 必 
然 有 六 条 腿 ， 因 为 蚂蚁 是 那个 类 的 成 员 。 

生物 的 比喻 帮助 阐释 类 和 对 象 之 间 的 区 别 。 尽 管 每 一 只 常见 的 黑色 花园 蚂蚁 都 属于 相同 
的 生物 类 别 ， 但 有 着 许多 常见 黑色 花园 蚂蚁 的 个 体 。 这 样 ， 每 一 只 黑 蚁 


都 是 Lasius niger 的 一 个 实例 。 在 面向 对 象 程序 语言 中 ，Lasius niger 是 一 个 类 ， 并 且 每 一 只 
蚂蚁 都 是 一 个 对 象 。 
44.2 流 类 层次 

流 库 中 形成 层次 的 类 在 很 多 方面 和 前 面 章节 中 介绍 的 生物 层次 是 类 似 的 。 到 目前 为 
止 ， 你 已 经 见 过 两 种 类 型 的 输入 流 (ifstream 和 istringstream) 和 两 种 类 型 的 输出 流 


(ofstream 和 ostringstream)， 在 每 一 对 流 中 ， 它 们 都 共享 一 组 常见 的 操作 。 在 C++ 
中 ， 形 成 层次 的 这 些 类 如 图 4-6 所 示 。 层 次 的 顶端 是 类 ios， 它 代表 一 个 最 通用 的 流 类 型 ， 
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图 4-6 流 层次 中 的 一 些 类 


然后 该 层次 类 被 细 分 为 两 种 类 别 (istream Fl ostream), 分 别 概括 了 输入 流 和 
输出 流 的 概念 。 自 然而 然 地 ，C++ 文件 和 字符 串 流 类 就 落 在 了 层次 中 恰当 的 位 置 ， 如 上 
所 示 。 

图 4-6 提供 了 一 个 有 用 的 框架 来 介绍 与 面向 对 象 程序 相关 的 一 些 专用 术语 。 如 图 4-5 所 
示 ， 这 个 图 同样 使 用 了 一 些 几 何 结构 绘制 而 成 ， 在 该 图 中 ， 每 一 个 类 都 是 出 现在 它 上 面 层次 
的 类 的 子 类 (subclass), At, istream Ml ostream 都 是 ios 的 子 类 。 相 反 地 ，ios 被 
称 作 是 istream 和 ostream 共同 的 父 类 (superclass)。 类 似 的 关系 存在 于 这 个 图 的 不 同 层 
次 中 。 例 如 ，ifstream 是 istream 的 子 类 ，ostream 是 ofstreanm 的 父 类 。 

子 类 和 父 类 的 关系 在 很 多 方面 可 以 用 英语 词组 “is a” 很 好 地 表达 出 来 。 每 一 个 
ifstream 对 象 也 是 一 个 (isa) istream 对 象 ， 沿 着 类 层次 继续 向 上 ， 每 一 个 ifstream 
对 象 也 是 一 个 (is a) ios 对 象 。 正 如 在 生物 层次 中 的 一 样 ， 这 个 关系 表示 任何 类 的 特征 都 
被 它 的 子 类 所 继承 。 在 C++ 中 ， 这 些 对 应 于 方法 和 其 他 定义 的 特征 都 和 类 有 联系 。 因 此 ， 
如 果 istream 类 提供 了 一 个 特殊 的 方法 ， 对 于 任何 ifstream 和 istringstream WR, 
该 方法 都 是 自动 可 用 的 。 更 全 面 地 说 ， 任 何 由 ios 类 提供 的 方法 对 于 图 4-6 层次 中 任意 一 
个 它 的 子 类 对 象 都 是 可 用 的 。 

尽管 只 展示 类 之 间 关 系 的 简单 图 是 很 有 价值 的 ， 但 是 扩展 这 些 关 系 使 其 包含 每 一 层 
类 提供 的 方法 也 是 很 有 用 的 ， 如 图 4-7 所 示 。 这 个 扩展 图 采用 了 部 分 的 标准 的 方法 来 阐释 
类 的 层次 ， 这 个 方法 称 之 为 统一 建 模 语言 ( Universal Modeling Language) ,或 者 简称 为 
UML。 在 UML 中 ， 每 个 类 以 一 个 矩形 框 表示 ， 它 的 上 部 分 包含 了 类 的 名 字 。 类 提供 的 方 
法 出 现在 矩形 框 的 下 部 分 。UML 图 使 用 空心 的 箭头 以 从 子 类 指向 它们 的 父 类 来 表示 继承 
关系 。 

如 图 4-7 所 示 ，UML 图 的 分 类 使 得 很 容易 确定 对 于 图 中 的 每 一 个 类 ， 什 么 方法 是 可 用 
的 。 因 为 每 个 类 继承 了 它 的 父 类 链 中 每 个 类 的 方法 ， 一 个 特定 类 的 对 象 都 可 以 调用 其 父 类 所 
定义 的 方法 。 例 如 ， 该 图 表示 ifstream 对 象 可 以 调用 下 面 的 方法 : 

e 来自 ifstream 类 本 身 的 open Fl close 方法。 

e 来 自 istream 类 的 get 和 unget 方法 以 及 >> 操作 符 。 

e 来 自 ios 类 的 clear、fail 和 eof 方法 。 
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E 4-7 流 层 次 简化 的 UML 图 


4.4.3 在 流 层次 中 选择 正确 的 层次 
你 所 需要 作出 的 最 重要 的 决策 之 一 是 : 当 使 用 对 象 层次 时 ， 你 要 选择 适合 工作 的 正确 层 
次 。 作 为 一 个 一 般 的 规则 ， 最 好 是 编写 你 自己 的 代码 ， 这 样 它 能 使 用 类 层次 中 最 一 般 的 类 来 
支持 你 所 需要 的 操作 。 采 用 这 种 规则 能 确保 你 的 代码 能 尽 可 能 灵活 地 支持 最 广泛 的 类 型 。 
作为 一 个 例子 ， 你 会 经 常 发 现 定 义 一 个 copyStream 方 法 是 很 有 用 的 ， 它 的 作用 是 将 
来 自 一 个 输入 流 中 的 所 有 字符 复制 到 另 一 个 输入 流 中 。 如 果 当 你 使 用 文件 流 时 ， 你 已 经 想到 
这 个 方法 ， 你 可 能 会 尝试 像 下 面 这 样 来 实现 这 个 方法 : 


void copyStream(ifstream & infile, ofstream & outfile) ( 
while (true) ( 


B int ch = infile.get(); w 
if (ch == EOF) break; | 
outfile.put(ch); 

) 


) 


尽管 这 种 实现 从 技术 上 来 说 是 正确 的 ， 但 它 对 于 错误 定位 仍 会 有 很 多 问题 。 问 题 是 如 果 你 已 
经 选择 了 更 多 类 型 的 参数 ， 即 使 这 段 代码 已 经 完美 地 适用 于 任何 类 型 的 输入 输出 流 ， 这 个 方 
法 仍 只 适用 于 文件 流 。copyStream 方法 一 种 更 灵活 地 实现 如 下 所 示 : 


void copyStream(istream & is, ostream & os) ( 
char ch; 
while (is.get(ch)) { 
os.put(ch); 
) 
} 
新 代码 的 优势 在 于 你 可 以 使 用 这 个 版 本 的 copyStream 方 法 处 理 所 有 的 流 类 型 。 例 如 ， 已 
经 给 出 了 copyStream 方法 的 这 种 实现 ， 你 可 以 在 ShowFileContents 中 用 单独 的 一 行 


语句 来 替换 while 循环 ， 如 下 如 示 : 


copyStream(infile, cout); 
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该 行 语句 的 作用 是 将 文件 中 的 内 容 复制 到 cout 中 。 之 前 的 版 本 〈 其 中 第 二 个 参数 被 声明 为 
一 个 ofstream 类 而 不 是 更 一 般 的 类 ostream) 失败 了 ， 因 为 cout 不 是 一 个 文件 流 。 


4.5 simpio.h 和 filelib.h 库 


第 3 章 介绍 了 几 种 新 的 函数 ， 将 它们 打包 成 类 似 strlib.h 库 的 形式 是 很 有 用 的 。 在 
这 一 章 中 ， 你 已 经 见 过 几 种 有 用 的 处 理 流 的 工具 ， 在 Stanford 类 库 中 ， 流 已 封装 为 两 种 接 
O: 第 2 章 介 绍 的 simpio.h 接口 和 用 于 文件 密切 相关 的 方法 的 filelib.h 接口 。 

尽管 可 以 在 这 本 书 的 排序 表 中 将 这 些 接口 的 内 容 都 列 出 来 ， 但 大 部 分 现代 的 接口 在 书 中 
都 没有 描述 。 随 着 网 络 的 扩展 ， 程 序 员 使 用 在 线 参 考 材料 多 于 打印 的 材料 。 例 如 ， 图 4-8 展 
示 了 关于 simpio.h 库 的 基于 网 络 版 的 在 线 文档 。 

虽然 表 列 描述 非常 适合 打印 在 纸张 上 ,但 基于 网 络 版 的 在 线 文档 更 适合 在 线 浏览 ， 但 你 
还 有 另 一 种 选择 来 学 习 一 个 接口 中 什么 资源 是 可 用 的 : 你 可 以 阅读 .h 文件 。 如 果 一 个 接口 
能 有 效 地 被 设计 并 记录 ， 阅 读 .nh 文件 可 以 提供 你 所 需 的 所 有 信息 。 在 任何 情况 下 ， 如 果 你 
想 精 通 C++， 阅 读 .h 文件 是 你 需要 培养 的 一 项 编程 技能 。 

为 了 使 你 在 阅读 接口 方面 进行 一 些 实践 ， 你 应 该 阅读 由 Stanford 类 库 提供 的 filelib. 
h 接口 。 这 个 接口 包括 了 本 章 给 出 的 promptUserForFile 函数 ， 以 及 许多 其 他 的 函数 ， 
当 你 处 理 文件 时 ， 它 们 迟早 会 有 用 。 





这 个 接口 提供 了 一 组 简化 C++ 输入 /输出 操作 的 函数 ， 并 且 提 供 一 些 关于 控制 台 输 入 的 错误 
检测 。 

函数 

getInteger (prompt) | 从 cin 中 读 取 一 个 完整 的 行 ， 并 且 尝 试 将 它 当 作 一 个 整数 输入 
getReal (prompt) 从 cin 中 读 取 一 个 完整 的 行 ， 并 且 尝 试 将 它 当 作 是 一 个 浮 点 数 输 入 














getLine(prompt) | 从 cin 中 读 取 一 个 完整 的 行 ， 并 且 将 该 行文 本 作为 一 个 字符 串 返 回 
函数 细节 





int getInteger(string prompt = ""); 


从 cin 中 读 取 一 个 完整 的 行 ， 并 且 将 它 当 作 是 一 个 整数 输入 。 如 果 输 入 成 功 ， 返 回 整数 值 。 
如 果 参 数 不 是 一 个 合法 的 整数 或 者 字符 串 中 出 现 无 关 字符 〈 除 了 空白 ) ， 给 予 用 户 一 次 重 
新 输入 值 的 机 会 。 如 果 提 交 ， 可 选择 的 prompt 字 符 串 将 会 在 读 取 值 之 前 打印 。 


用 法 : 
int n = getInteger (prompt); 
double getReal(string prompt - ""); 


从 cin 中 读 取 一 个 完整 的 行 ， 并 且 将 它 当 作 是 一 个 浮 点 数 输 入 。 如 果 输 入 成 功 ， 返 回 浮 点 数 
值 。 如 果 参 数 不 是 一 个 合法 的 数 或 者 字符 串 中 出 现 无 关 字符 (除了 空白 ) ， 给 予 用 户 一 次 
重新 输入 值 的 机 会 。 如 果 提交 ， 可 选择 的 prompt 字 符 串 将 会 在 读 取 值 之 前 打印 。 


用 法 : 
double x = getReal (prompt); 


string getLine(string prompt = ""); 
从 cin 中 读 取 一 行文 本 ， 并 且 将 该 行文 本 作为 一 个 字符 串 。 结 束 输入 的 新 一 行 的 字符 不 会 
作为 返回 值 的 一 部 分 进行 存储 。 如 果 提 交 ， 可 选择 的 prompt 字 符 串 将 会 在 读 取 值 之 前 打印 。 
用 法 : 
string line = getLine (prompt); 











图 4-8 关于 simpio.h 接口 的 在 线 文 档 
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本 章 小 结 
在 本 章 ， 你 已 经 学 会 了 如 何 使 用 流 层次 中 的 库 去 支持 涉及 控制 台 、 字 符 串 和 数据 文件 的 
输入 /输出 操作 。 本 章 要 点 包括 : 


<iostream> 库 提供 了 三 种 标准 流 : cin、cout 和 cerr。 

<iomanip> 库 使 得 控制 输出 格式 成 为 可 能 。 这 个 库 提供 了 一 组 流 操 纵 符 ， 其 中 最 重 
要 的 流 操 纵 符 出 现在 表 4-1 中 。<iomanip> 库 也 包含 了 输入 流 操纵 符 ， 但 它们 在 实 
际 中 不 如 输出 流 操纵 符 重 要 。 

C++ 中 的 <fstream> 库 提供 了 读 写 数据 文件 的 功能 。 应 用 在 文件 流 中 的 最 重要 的 
方法 列举 在 表 4-3 中 。 

当 读 取 一 个 文件 时 ，C++ 流 库 允许 你 任意 选择 几 种 不 同 策略 类 的 任意 一 种 。 你 可 以 
使 用 get 方法 逐个 字符 读 取 文件 ， 也 可 以 使 用 getline 方法 逐 行 读 取 文 件 ， 或 者 
使 用 >> 提取 操作 符 格式 化 数据 。 

<sstream> 库 使 得 我 们 使 用 >> 和 << 操作 符 来 读 写字 符 串 数据 成 为 可 能 。 

流 库 中 的 类 形成 了 一 个 类 层次 ， 其 中 子 类 继承 了 父 类 的 行为 。 当 你 设计 函数 处 理 流 
时 ， 重 要 的 是 选择 类 层次 中 最 一 般 的 类 ， 其 中 必要 的 操作 都 有 定义 。 

在 前 3 章 的 很 多 地 方 ， 文 中 定义 的 新 函数 被 证 明 在 许多 情况 下 是 很 有 用 的 。 这 些 函 
数 通过 组 成 Stanford C++ 库 的 几 个 接口 被 导出 ， 这 确保 了 你 不 需要 复制 代码 就 可 以 
使 用 它们 。 


复习 题 


1. <iostream> 库 定义 的 三 个 标准 文件 流 是 什么 ? 

2. << 和 >> 操作 符 的 正式 名 称 是 什么 ? 

3. << 和 >> 操作 符 返 回 什 么 值 ? 这 个 值 为 什么 重要 ? 

4. 什么 是 流 操纵 符 ? 

5. 短暂 性 和 持久 性 的 区 别 是 什么 ? 

6. 用 你 自己 的 话 描述 fixed Fl scientific 流 操纵 符 怎 样 改变 浮 点 输出 的 格式 。 如 果 你 不 指定 这 些 选 
择 ， 将 会 发 生 什么 ? 

7. 假设 常量 PI 定义 如 下 : 


const double PI = 3.14159265358979323846; 


你 将 会 使 用 什么 输出 流 操纵 符 来 产生 下 面 例 子 中 的 每 一 行 运 行 结果 : 


3. 141592653589793 
3.141593 
3.141592653589793e*00 


3.141593E+00 





8. 类 ifstream 和 ofstream 的 功能 是 什么 ? 

9. open 参数 必须 是 一 个 C 风格 的 字符 串 。 这 个 要 求 是 如 何 影响 你 编写 的 打开 一 个 文件 的 代码 ? 
10. 你 是 如 何 确定 流 中 的 一 个 open 操作 是 否 成 功 ? 

11. 当 你 使 用 get 方法 去 逐个 字符 读 取 文 件 时 ， 你 怎样 发 现 一 个 文件 的 结尾 ? 


p x 129 


12. 为 什么 get 的 返回 类 型 是 int 而 不 是 char ? 

13. unget 方法 的 目的 是 什么 ? 

14. 当 你 使 用 getline 方法 去 逐 行 读 取 文件 时 ， 你 怎样 发 现 一 个 文件 的 结尾 ? 

15. <sstream> 库 支持 什么 类 ?这 些 类 和 <fstream> 提供 的 类 有 什么 区 别 ? 

16. 下 面 术 语 的 含义 是 什么 : 子 类 、 父 类 和 继承 ? 

17. 判断 题 : 图 4-7 中 stream 类 层次 展示 了 istream Æ istringstream 的 一 个 子 类 。 

18. 为 什么 copyStream 函数 用 istream 和 ostream 类 型 的 参数 代替 ifstream 和 ofstream 类 
型 的 参数 ? 

19. 相 比 使 用 >> 提取 操作 符 ， 使 用 来 自 simpio.h 的 getInteger 和 getReal 函数 有 什么 
优势 ? 

20. 如 果 文 中 没有 用 表 列 形式 来 描述 一 个 库 提供 的 函数 ， 你 有 哪些 选择 去 学 习 如 何 使 用 这 个 库 ? 


习题 


1.<iomanip> 库 使 得 程序 员 更 好 地 控制 输出 格式 ， 例 如 ， 使 得 创建 格式 化 表 变 得 容易 。 编 写 一 个 程 
序 ， 展示 一 个 三 角 函 数 正弦 和 余弦 值 的 表 ， 如 下 所 示 : 








theta | A a 1 aco tibnbn) 1 
一 一 一 一 一 一 十 一 一 一 一 一 一 一 一 一 一 一 一 十 一 一 一 一 一 一 一 一 一 一 一 一 十 
-90 | -1.0000000 | 0.0000000 | 
-75 | -0.9659258 | 0.2588190 | 
-60 | -0.8660254 | 0.5000000 | 
-45 | -0.7071068 | 0.7071068 | 
-30 | -0.5000000 | 0.8660254 | 
-15 | -0.2588190 | 0.9659258 | 
O | 0.0000000 | 1.0000000 | 
15 | 0.2588190 | 0.9659258 | 
| 30 | 0.5000000 | 0.8660254 | 
45 | 0.7071068 | 0.7071068 | 
60 | 0.8660254 | 0.5000000 | j| 

75 | 0.9659258 | 0.2588190 | | 

90 | 1.0000000 | 0.0000000 | A 

v 

Án n À —Á a 


数值 列 应 该 右 对 齐 ， 包 含 三 角 函 数 ( 度 数 以 15 度 间隔 列举 ) 的 列 应 该 在 小 数 点 后 有 七 位 数字 。 
2. 在 第 2 章 的 习题 4 中 ， 你 编写 过 一 个 函数 windchil1， 该 函数 根据 给 出 的 温度 和 风速 计算 风寒 指 
数 。 编 写 一 个 程序 ， 要 求 使 用 这 个 函数 用 列表 的 形式 显示 这 些 值 ， 正 如 图 2-17 中 来 自 国 家 气象 局 的 
表 所 示 。 

3. 编写 一 个 程序 ， 要 求 输出 用 户 选 择 的 文件 中 最 长 的 行 。 如 果 有 几 行 是 相同 的 长 度 ， 你 的 程序 应 该 输 
出 第 一 个 满足 的 行 。 

4. 编写 一 个 程序 ， 要 求 读 取 一 个 文件 并 输出 文件 行 数 、 单 词 总 数 和 字符 总 数 。 为 此 ， 一 个 单词 是 由 一 
个 连续 的 字符 序列 组 成 的 ， 除 了 空白 字符 。 作 为 一 个 例子 ， 假 设 文件 Lear.txt 包含 下 面 这 些 来 自 
WE LEER EY BRE 


Lear.txt 


Poor naked wretches, wheresoe'er you are, 
That bide the pelting of this pitiless storm, 
How shall your houseless heads and unfed sides, 


Your loop'd and window'd raggedness, defend you 
From seasons such as these? O, I have ta'en 
Too little care of this! 





你 的 程序 应 该 能 产生 以 下 的 运行 结果 : 
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输出 的 数值 必须 具有 适当 的 数据 位 并 且 是 右 对 齐 的 。 例 如 ， 如 果 你 有 一 个 包含 整个 乔治 ， 艾 略 
特 的 米 德尔 马 契 (Middlemarch) 文本 的 文件 ， 你 的 程序 输出 应 该 如 下 所 示 : 








A P 
M»OO 


file: Middlemarch.txt 
Chars: 1796948 
|Words: 316689 
| Linas; 34037 


| 
| 





一 一 一 






~ 


5. filelib.h 接口 提供 了 几 个 函数 使 得 处 理 文件 名 变 得 容易 。 尤 其 是 函数 getRoot 和 getExtension 
将 一 个 文件 分 成 根部 (文件 名 中 点 的 前 半 部 分 ) 和 扩展 名 (表示 文件 类 型 )。 例 如 ， 给 出 文件 名 
Middlemarch.txt， 根 部 是 Middlemarch， 扩展 名 是 .txt (注意 到 filelib.h 定义 扩展 名 包 
含 点 )。 编 写 必要 的 代码 实现 这 些 函 数 。 为 了 发 现 怎 样 处 理 特殊 情况 ,例如 文件 名 不 包含 一 个 点 ， 你 
可 以 阅读 filelib.h 接口 或 者 查阅 在 线 文档 。 

6. f£ilelib.h 中 另 一 个 有 用 的 方法 是 : 


string defaultExtension(string filename, string ext); 


如 果 filename 没有 扩展 名 ， 它 就 将 ext 添加 到 filename 的 末尾 。 例 如 : 


defaultExtension("Shakespeare", ".txt") 

将 会 返回 “ Shakespeare.txt”. WR filename 已 经 有 了 扩展 名 ， 将 返回 不 做 任何 改变 的 文件 
名 ， 以 下 语句 : 
defaultExtension("library.h", ".cpp") 


将 会 忽略 这 个 指定 的 扩展 名 ， 并 返回 不 作 改 变 的 “1ibrary.h”。 然 而 ， 如 果 ext 在 点 之 前 包含 
了 一 个 星 号 ，defaultExtension KHER filename 中 现存 的 扩展 名 ， 并 添加 新 的 扩展 名 MEE 
号 )。 因 此 ， 以 下 语句 : 


defaultExtension("library.h", "*.cpp") 


KZE “ library.cpp”. WdefaultExtension 函数 编写 代码 ， 使 得 它 像 本 题 描述 的 那样 
运行 。 

7. 有 时 ， 出 版 商 发 现 不 被 实际 单词 分 心地 评价 布局 和 格式 设计 是 很 有 用 的 。 为 此 ， 他 们 有 时 用 这 样 的 
方法 来 排版 示例 页 面 : 将 所 有 原始 的 字母 用 随机 的 字母 来 替换 。 结 果 文 本 有 原始 的 空格 和 标点 结构 ， 
但 单词 采用 了 这 种 方法 的 设计 后 不 再 表达 任何 的 含义 。 这 种 替换 文本 的 出 版 项 目的 方法 是 greek， 大 
概 是 在 古老 的 谚语 “ It's all Greek to me” 后 ， 它 才 被 应 用 在 莎士比亚 的 《凯撒 大 帝 》 中 的 一 行文 
字 中 。 l 

编写 一 个 程序 ， 从 一 个 输入 文件 中 读 取 字 符 ， 进 行 适 当 的 随机 替换 后 ， 将 它们 显示 在 控制 台 上 。 
你 的 程序 应 该 将 输入 中 的 每 个 大 写字 母 用 随机 的 大 写字 母 蔡 换 ， 每 个 小 写字 母 用 随机 的 小 写字 母 替 
换 。 非 字母 表 字 符 应 该 保持 不 变 。 例 如 ， 假 设 输入 文件 Troilus.txt 包含 下 面 的 来 自 莎 士 比 亚 的 《 特 
洛 伊 罗斯 克 瑞 西 达 》(Tnoilus and Cressida) 的 文本 : 
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Troilus.txt 


Ay, Greek; and that shall be divulged well 
In characters as red as Mars his heart 
Inflamed with Venus: 


你 的 程序 产生 的 输出 应 该 如 下 所 示 : 





8. 尽管 注释 对 人 类 读者 来 说 很 重要 ， 但 编译 器 会 简单 地 忽略 它们 。 如 果 你 正在 编写 一 个 编译 器 ， 因 此 
需要 能 够 识别 并 消除 出 现在 源 文件 中 的 注释 。 
编写 一 个 函数 : 


void removeComments (istream & is, ostream & os); 192 


除了 出 现在 C++ 注释 中 的 字符 ,该 函数 将 来 自 输入 流 is 中 的 字符 复制 到 输出 流 os 中 。 你 实现 的 
程序 应 该 能 识别 两 种 注释 公约 : 

o 任何 以 /* 开始 并 以 */ 结束 的 文本 ， 可 能 其 中 有 很 多 行 。 

© 任何 以 // 开始 的 文本 ， 扩 展 到 行 的 结尾 。 

真正 的 C++ 编译 器 需要 检测 确保 这 些 字符 不 包含 在 引用 字符 串 内 ， 但 是 忽略 该 细节 你 应 该 感到 很 舒 
服 ， 问 题 是 它 十 分 狭 猎 。 

9. 在 詹姆斯 * 瑟 伯 的 童话 故事 “奇怪 的 字母 (The Wonderful 0)” 中 ， 奥 罗 岛 被 私人 侵略 了 ， 侵略 者 
准备 将 字母 O 从 字母 表 中 删除 。 和 现在 的 知识 相 比 ， 这 样 的 审查 制度 将 更 容易 。 编 写 一 个 程序 ， 要 
求 用 户 提供 一 个 输入 文件 、 一 个 输出 文件 和 一 个 将 要 被 消除 的 字母 字符 串 。 然 后 程序 要 将 输入 文件 
的 内 容 复制 到 输出 文件 中 ， 删 除 任何 出 现在 被 检查 过 的 字母 中 的 字符 ， 无 论 它 们 以 大 写字 母 形式 出 
现 还 是 以 小 写字 母 形式 出 现 。 

作为 一 个 例子 ， 假 设 你 有 一 个 包含 瑟 伯 的 小 说 开头 几 行 文字 的 文件 ， 如 下 所 示 : 


TheWonderfulO.txt 


Somewhere a ponderous tower clock slowly 
dropped a dozen strokes into the gloom. 


Storm clouds rode low along the horizon, 
and no moon shone. Only a melancholy 
chorus of frogs broke the soundlessness. 





如 果 你 使 用 这 样 的 输入 来 运行 你 的 程序 : 


Letters to banish: o 





它 应 该 显示 出 下 面 这 样 的 文件 : 193 


[194 
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TheWnderful .txt 


Smewhere a pnderus twer clck slwly 
drpped a dzen strkes int the glm. 
Strm cluds rde lw alng the hrizn, 
and n mn shne. nly a melanchly 
chrus f frgs brke the sundlessness. 








如 果 你 尝试 更 贪心 一 点 ， 想 要 消除 所 有 的 元 音字 母 ， 你 可 以 通过 输入 aeiou 来 对 应 这 个 命令 ， 输 出 
文件 的 内 容 如 下 所 示 : 


Smwhr pndrs twr clck slwly 
drppd dzn strks nt th glm. 


Strm clds rd lw lng th hrzn, 
nd n mn shn. nly mlnchly 
chrs f frgs brk th sndlssnss. 





10. 某 些 文件 使 用 制 表 符 使 数据 分 成 不 同 的 列 。 然 而 ， 这 样 做 会 产生 应 用 问题 ， 即 应 用 不 能 直接 使 用 
制 表 符 。 对 于 这 些 应 用 ， 一 个 有 用 的 方式 是 编写 一 个 程序 ， 将 输入 文件 中 的 制 表 符 用 若干 空格 符 代 
蔡 ， 空 格 要 求 一 直 持 续 到 下 一 个 制 表 符 停 止 的 位 置 。 在 程序 中 ， 通 常 制 表 符 停止 的 位 置 设置 在 每 作 
列 处 。 例 如 ， 假 设 输入 文件 包含 下 面 形式 的 一 行 字 符 : 


abc ——4pqrst 一 | xyz 


其 中 a 符号 表示 空格 被 制 表 符 所 代替 ， 区 别 依赖 于 它 在 这 一 行 中 的 位 置 。 如 果 制 表 符 停止 的 位 置 
设置 在 每 八 列 处 ， 第 一 个 制 表 符 必须 被 五 个 空格 代替 ， 第 二 个 制 表 符 被 三 个 空格 代替 。 
编写 一 个 程序 ， 将 输入 文件 中 的 内 容 复制 到 输出 文件 ， 并 将 其 中 所 有 的 制 表 符 用 适当 数目 的 空 
格 代替 。 
11. 使 用 函数 stringToInteger fil integerToString 作为 一 个 模型 ， 编 写实 现 函 数 stringToReal 
和 realToString 所 需 的 必要 代码 。 
12. 通过 实现 函数 getReal 和 getLine 未 完成 simpio.h 接口 的 实现 。 
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这 样 ， 我 就 有 了 一 个 很 有 价值 的 收藏 了 。 
— — Àj jt, + 吐 温 ,《 国 外 漫游 》4 Tramp Abroad), 1880 


正如 你 的 编程 经 验 所 告诉 你 的 ， 数 据 结构 可 以 进行 组 合 以 形成 层次 结构 。 像 int、 
char, double 这 样 的 基本 类 型 代表 这 些 层次 结构 的 基本 构造 块 。 为 了 表示 更 复杂 的 信 
息 ， 你 可 以 把 不 同 的 基本 类 型 组 合 在 一 起 以 形成 一 个 更 大 的 结构 。 在 不 断 地 扩充 过 程 中 ， 这 
些 较 大 的 结构 可 以 再 次 被 组 装 成 一 个 更 大 的 结构 。 这 些 组 合 的 结构 被 统称 为 数据 结构 ( data 


structure) 。 


随 着 不 断 地 深入 学 习 编程 ， 你 会 发 现 特殊 的 数据 结构 是 很 有 用 的 ， 并 且 值 得 深入 学 习 。 


此 外 ， 了 解 如 何 去 高 效 地 使 用 这 些 数据 结构 远 比 了 解 它们 的 内 部 表示 要 重要 得 多 。 例 如 ， 即 
使 一 个 字符 串 在 机 器 内 被 表示 为 一 个 字符 数组 ， 它 还 是 有 一 些 抽 象 行为 超出 了 它 的 内 部 表 
示 。 一 种 类 型 是 根据 它 的 行为 而 不 是 其 内 在 表示 定义 的 ， 我们 称 这 种 类 型 为 一 种 抽象 数据 类 
Æ! (abstract data type), 通常 简 写 为 ADT。 抽 象 数据 类 型 是 面向 对 象 编程 风格 的 核心 ， 它 鼓 
励 编 程 人 员 用 全 局 的 方式 来 考虑 数据 结构 。 

本 章 介 绍 五 个 类 一 一 Vector、Stack、Queue、Map 和 Set， 其 中 每 一 个 类 都 代表 了 
一 种 重要 的 抽象 数据 类 型 。 此 外 ， 它 们 都 包含 了 一 些 简单 类 型 值 的 集合 。 因 此 ， 这 些 类 被 称 
为 集合 类 (collection classe)。 暂 时 你 不 需要 了 解 这 些 类 是 如 何 实 现 的 ， 因 为 你 应 重点 关注 
的 是 作为 一 个 用 户 去 学 习 如 何 使 用 这 些 类 。 在 后 续 的 章节 中 ， 你 将 有 机 会 去 探索 各 种 类 的 实 
现 策略 ， 并且 学 习 一 些 必要 的 算法 和 数据 结构 以 获得 更 高 效 的 实现 。 

把 类 的 行为 与 其 底层 的 实现 相 分 离 是 面向 对 象 编程 的 一 项 基本 技术 。 作 为 一 种 设计 策 
WE. ， 维 持 这 种 分 离 可 提供 以 下 优势 : 

e 简单 性 ( simplicity)。 对 用 户 隐 藏 类 的 内 部 表示 意味 着 用 户 只 有 较 少 的 细节 需要 去 

理解 。 

e 灵活 性 (flexibility)。 因 为 一 个 类 是 根据 其 对 外 公开 的 行为 来 定义 的 ， 实 现 一 个 类 的 
程序 员 可 以 自由 地 改变 该 类 的 内 部 私有 表示 。 和 任何 抽象 一 样 ， 只 要 保持 类 的 对 外 
接口 不 变 就 可 以 适当 地 改变 其 内 部 实现 。 

e 安全 性 (security)。 类 的 接口 扮演 了 防火 墙 的 角色 ， 它 确保 了 类 的 实现 和 用 户 的 彼 
此 分 离 。 如 果 一 个 用 户 程序 有 权 访 问 类 的 内 在 表示 ， 则 它 可 以 以 出 乎 预料 的 方式 来 
改变 类 中 的 内 部 数据 结构 中 的 值 。 设 定 类 中 的 数据 为 私有 的 ， 防止 了 用 户 对 其 做 出 
改变 。 

为 了 使 用 本 章 中 所 介绍 的 任意 集合 类 ， 你 必须 包含 适当 的 接口 ， 就 像 在 前 面 的 章节 中 
你 使 用 库 一 样 。 每 个 集合 类 的 接口 仅仅 由 类 的 名 字 的 首 字 母 小 写 以 及 在 最 后 跟着 一 个 扩展 
名 .h 拼写 而 成 。 例 如 ， 为 了 在 程序 中 使 用 Vector 类 ， 你 必须 在 你 的 源 文件 开始 处 添加 下 
面 这 行 代码 : 
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#include "vector.h" 


本 书 中 使 用 的 集合 类 是 受 一 个 更 高 级 的 类 集合 所 启发 ， 并 由 此 衍生 而 来 。 这 个 类 集合 被 
称 之 为 标准 模板 库 (Standard Template Library)， 或 简称 为 STL。 尽 管 STL 足够 强大 ,但 无 
论 你 是 作为 类 的 用 户 还 是 作为 实现 者 ， 理解 它 都 是 很 困难 的 。 使 用 STL 简单 版 本 的 一 个 好 
处 就 是 : 在 你 学 习 完 本 书 时 ， 你 可 以 完全 理解 它 的 实现 。 了 解 类 是 如 何 实现 的 会 让 你 对 之 后 
标准 模板 库 的 用 途 有 更 深入 的 理解 。 


5.1 Vector 类 


最 有 价值 的 集合 类 之 一 就 是 Vector 类 ， 它 提供 了 一 种 类 似 于 你 在 早期 编程 中 曾 遇 到 
过 的 具有 数组 功能 的 机 制 。 早 期 的 编程 大 量 使 用 数组 。 和 大 多 数 编程 语言 一 样 ，C++ 也 支持 
数组 ， 你 将 在 第 11 章 学 习 数 组 是 如 何 工 作 的 。 然 而 ，C++ 中 的 数组 有 若干 缺点 ， 主 要 包括 : 
e 数组 被 分 配 具 有 固定 大 小 的 内 存 ， 以 致 于 程序 员 不 能 在 以 后 对 其 大 小 进行 改变 。 
e 即使 数组 有 固定 的 大 小 ，C++ 也 不 允许 程序 员 获 得 这 个 大 小 。 因 此 ， 典 型 的 含有 数 
组 的 程序 需要 一 个 附加 的 变量 来 记录 数组 元 素 的 个 数 。 
© 传统 的 数组 不 支持 插入 和 删除 数组 元 素 的 操作 。 
e C++ 对 数组 越界 不 做 检查 。 例 如 : 如 果 你 创建 了 一 个 含有 25 个 元 素 的 数组 ， 之 后 你 
试图 挑选 出 索引 为 50 的 数组 元 素 值 ，C++ 仅 查看 在 索引 为 50 内 存 地 址 中 是 否 有 数 
据 存 在 。 
Vector 类 通过 以 抽象 数据 类 型 的 方式 重新 实现 数组 解决 了 上 述 问题 。 你 可 以 在 任何 应 
用 中 使 用 Vector 类 代替 传统 的 数组 ， 通 常 在 源 代码 中 只 需 进 行 很 少 的 修改 和 较 小 的 删 减 
就 会 产生 出 人 意料 的 高 效 结果 。 实 际 上 , 一 旦 你 有 了 Vector 类 ， 在 很 多 场景 中 就 不 会 再 
使 用 数组 ， 除 非 你 实际 上 必须 实现 和 Vector 一 样 的 类 ， 这 个 类 使 用 数组 作为 它 隐藏 的 数 
据 结 构 。 然 而 ， 作 为 一 个 Vector 类 的 用 户 ， 你 可 能 不 会 对 其 隐藏 的 数据 结构 感 兴趣 ， 而 
把 相关 的 数组 结构 问题 留 给 程序 员 ， 让 他 们 去 实现 这 个 抽象 数据 类 型 。 
作为 一 个 Vector 类 的 用 户 ， 你 会 面临 一 组 不 同 的 问题 并 且 需 要 回答 以 下 问题 : 
1. 如 何 指定 包含 在 一 个 Vector 中 对 象 的 类 型 ? 
2. 如 何 创建 一 个 对 象 ， 它 是 一 个 Vector 类 的 实例 ? 
3. Æ vector 中 存在 什么 样 的 方法 来 实现 它 的 抽象 行为 ? 
接 下 来 的 三 节 会 依次 探索 上 述 问题 中 的 答案 。 


5.1.1 指定 Vector 的 基 类 型 


在 C++ 中 ， 集 合 类 通过 在 类 的 名 字 后 面 添加 一 对 包含 类 型 名 称 的 尖 括 号 来 指定 其 包含 对 
象 的 类 型 。 例 如 : 类 Vector<int> 指定 了 其 元 素 类 型 为 整数 ，Vecto r<char> 指定 了 其 
元 素 类 型 为 字符 ，Vector<string> 指定 了 其 元 素 类 型 为 字符 串 。 尖 括号 内 的 类 型 被 称 为 集 
合 的 基 类 型 (base type)。 

包含 基 类 型 规格 说 明 的 类 在 面向 对 象 中 被 称 之 为 参数 化 的 类 (parameterized class), 在 
C++ 中 ， 参 数 化 的 类 通常 被 称 为 模板 (template)， 它 反映 了 C++ 编译 器 将 Vector<int>、 
Vector<char>， 以 及 Vector<string> 这 些 共享 相同 结构 的 类 当 作 独立 的 类 的 事实 。 
Vector 这 个 名 字 扮 演 了 产生 只 有 其 包含 的 值 的 类 型 不 同 的 类 模板 的 角色 。 现 在 你 需要 理解 
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的 是 如 何 使 用 模板 ， 实 现 基 本 模板 的 过 程 将 在 第 14 章 中 阐述 。 


5.1.2 ”声明 Vector WR 


抽象 数据 类 型 背后 的 其 中 一 个 哲学 原理 是 : 用 户 应 能 够 想到 它们 好 像 就 是 一 个 内 置 的 基 
本 类 型 。 因 此 ， 正 如 你 会 用 下 面 的 声明 语句 来 声明 一 个 整 型 变量 一 样 : 


int n; 


通过 编写 下 面 的 声明 语句 ， 也 应 该 可 以 声明 一 个 新 的 Vector 对 象 : 


Vector<int> vec; 


在 C++ 中 ， 那 恰恰 是 你 要 做 的 。 在 上 述 的 声明 语句 中 ， 定 义 声明 了 一 个 Vector 类 的 名 为 
vec 的 新 变量 ， 且 正如 其 尖 括号 内 的 模板 参数 所 指明 的 ， 它 的 基 类 型 为 整 型 。 


5.1.3 Vector 的 操作 


当 你 声明 了 一 个 Vector 对 象 时 ， 它 的 初 值 是 一 个 空 矢 量 (empty vector)， 这 意味 着 
它 里 面 没 有 包含 任何 元 素 。 因 为 空 的 Vector 用 处 不 大 ， 你 需要 学 习 的 第 一 件 事 就 是 如 何 
向 一 个 Vector 对 象 里 面 添加 新 元 素 。 通 常 的 方法 是 调用 Vector 的 add 方法 ， 它 会 在 
Vector 对 象 的 最 后 添加 一 个 新 的 元 素 。 例 如 ， 如 果 vec 是 一 个 之 前 声明 过 的 基 类 型 为 整 
数 的 空 Vector 对 象 ， 执 行 以 下 代码 : 

vec.add(10); 


vec.add(20); 
vec.add(40); 


便 会 将 vec 变 为 含有 值 分 别 为 10、20 和 40 的 三 个 元 素 的 Vector 对 象 。 和 字符 串 中 的 字 
符 一 样 ，C++ 中 Vector 对 象 元 素 的 索引 从 0 开始 ， 这 就 意味 着 你 可 以 用 下 图 所 示 来 表示 
vec 中 的 内 容 : 


与 第 11 章 将 要 介绍 的 大 多 数 的 原始 数组 类 型 不 同 ，Vector 对 象 的 大 小 是 不 固定 的 ， 
这 意味 着 你 可 以 在 任何 时 候 向 其 添加 新 元 素 。 例 如 ， 在 上 述 代 码 后 你 可 以 调用 以 下 语句 : 


vec.add(50); 


ESHE Vector WH vec 的 最 后 添加 一 个 值 为 50 的 元 素 ， 如 下 图 所 示 : 


Vector 的 insert 的 方法 允许 你 在 一 个 Vector 对 和 象 中 添加 新 元 素 。insert 方法 的 
第 一 个 参数 是 插入 元 素 的 索引 号 ， 新 的 元 素 将 会 插入 在 索引 号 之 前 的 位 置 上 。 例 如 ,调用 以 
下 语句 : 

vec.insert(2, 30); 


将 在 索引 位 置 为 2 的 元 素 前 面 插入 一 个 值 为 30 的 元 素 ， 如 下 图 所 示 : 
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DOLDE 
Vector 类 在 其 内 部 实现 这 个 操作 需要 扩大 数组 的 存储 空间 ， 并 且 将 值 为 40 和 50 的 元 素 向 
后 移动 一 位 从 而 为 值 为 30 的 元 素 提供 存储 空间 。 从 用 户 的 观点 看 ， 这 个 操作 的 实现 很 少 考 
虑 那些 细节 ， 并 且 也 不 需要 理解 它 是 如 何 实现 的 。 
Vector 类 同时 也 允许 你 删除 其 中 的 元 素 。 例 如 ， 调 用 以 下 语句 : 


vec.remove (0) ; 


将 删除 索引 位 置 为 0 的 元 素 ， 之 后 vec 中 的 元 素 如 下 图 所 示 : 


0 1 2 3 


Vector 类 包含 两 个 查询 和 修改 单个 元 素 的 方法 。get 方法 获取 索引 值 所 对 应 的 元 素 ， 并 
将 某 元 素 返 回 。 例如， 给 定 上 图 所 示 的 vec 的 值 ， 调 用 vec .get (2) 将 会 返回 值 40。 

与 此 相对 应 ， 你 可 以 使 用 set 方法 来 改变 vec 中 已 经 存在 的 元 素 值 。 例 如 ， 调 用 以 下 
语句 : 

vec.set(3, 70); 


将 索引 位 置 为 3 的 值 由 50 改变 为 70， 如 下 图 所 示 : 


0 1 2 3 


get, set, insert Ml remove 方法 全 都 会 检查 和 确保 你 提供 的 索引 值 对 于 Vector 
对 象 来 说 是 合法 的 。 例 如 ， 如 果 你 调用 vec.get (4), get Jr 3k KE x WI error, 并 
报告 索引 值 为 4 对 vec (索引 值 在 0 一 3 之 间 ) 而 言 太 大 了 ， 已 越界 。 对 于 get、set 
fll remove Wik, Vector 的 实现 将 会 检查 其 索引 值 是 否 大 于 等 于 0 且 小 于 元 素 的 总 数 。 
insett 方 法 允许 索引 值 等 于 元 素 的 个 数 ， 这 种 情况 下 新 的 元 素 值 将 会 被 插 人 到 数组 的 最 
后 ， 这 正 与 add 方法 相同 。 

测试 一 个 索引 是 否 合法 的 操作 称 为 边界 检查 (bounds-checking )。 边 界 检查 更 易于 捕获 
编程 中 的 错误 ， 而 传统 的 数组 操作 常常 忽视 这 些 错误 。 


5.1.4 ”从 Vector 对 和 象 中 选择 元 素 


虽然 get 和 set 方法 易于 使 用 ， 但 几乎 每 个 人 都 不 调用 这 些 方法 。 让 C++ 与 其 他 大 多 
数 编程 语言 不 同 的 特性 之 一 是 在 类 中 可 以 重 载 标准 操作 符 。 这 种 特性 使 得 Vector 类 支持 
用 方 括号 去 指定 想 要 得 到 的 特定 索引 的 元 素 值 这 种 更 传统 的 语法 变 为 可 能 。 因 此 ， 为 了 查 
找 位 置 i 处 的 元 素 ， 就 像 使 用 传统 数组 那样 ， 你 可 以 使 用 表达 式 vec[i] 。 此 外 ， 你 可 以 通 
过 指定 一 个 新 的 值 赋 给 vecli] 来 改变 其 值 。 例 如 ， 你 可 以 在 vec 中 查找 索引 为 3 的 元 素 ， 
并 将 其 赋值 为 70: 


vec[3] = 70; 
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上 述 结果 的 语法 要 比 调用 set 方法 更 加 简短 ， 且 它 与 数组 操作 更 为 相似 ， 因 此 vector% 
去 设计 模仿 这 种 方法 。 

数组 中 用 来 查找 一 个 元 素 的 索引 可 以 是 任何 与 整数 相等 价 的 表达 式 。 其 中 最 常见 的 一 
个 索引 表达 式 为 for 循环 的 索引 ， 循 环 遍历 的 每 一 个 索引 值 是 有 序 的 。 在 一 个 Vector 对 象 
中 ， 对 于 通过 改变 索引 位 置 的 循环 大 体 模 式 都 如 下 所 示 : 


for (int i = 0; i < vec.size(); i++) { 
loop boc 
) 


在 上 述 循环 体内 ， 你 可 以 引用 当前 的 元 素 vec [i]。 
作为 一 个 例子 。 下 面 的 代码 输出 vec 中 元 素 的 内 容 ， 其 中 元 素 内 容 是 以 方 括号 括 起 来 
并 以 逗号 相 分 隔 : 


cout << "p"; 

for (int i = 0; i < vec.size(); i++) { 
if (i > 0) cout,«« " ; 
cout «« vec[i]; 

) 


cout «« "]" «« endl; 


如 果 你 执行 以 上 这 上段 代码 并 假定 vec 的 内 容 是 最 新 的 ， 你 将 会 在 屏幕 上 得 到 下 面 的 输出 : 


j (RE Pait 3 
[20, 30, 40, 70] 





5.1.5 ”作为 参数 传递 Vector HR 


上 一 小 节 结 束 处 的 代码 是 非常 有 用 的 (尤其 是 你 在 调试 并 且 需 要 查看 一 个 Vector WR 
中 所 包含 的 元 素 时 )， 为 此 值得 定义 一 个 函数 。 在 某 种 程度 上 ， 把 代码 封装 在 一 个 函数 内 很 
简单 ， 你 所 要 做 的 就 是 在 上 述 代 码 的 基础 上 添加 一 个 合适 的 函数 头 部 ， 如 下 所 示 : 


void PrintVector (Vector<int> & vec) { 
cout << "[": 
for (int i = 0; i < vec.size(); i++) { 
if (i > 0) cout << " 
cout << vec[i]; 
} 
cout << "]" << endl; 
} 


然而 ， 函 数 头 部 那 行 所 涉及 的 精妙 之 处 就 是 在 你 高 效 使 用 集合 类 之 前 你 必须 理解 它 。 正 如 
第 2 章 所 描述 的 ， 在 参数 名 字 前 面 的 “& ”表明 参数 vec 是 通过 引用 传递 的 ， 这 就 意味 着 
函数 内 的 值 和 调用 者 的 值 是 共享 的 ， 引 用 调用 比 C++ 默认 的 需要 复制 Vector 对 象 中 每 
一 个 元 素 的 值 调用 更 高 效 。 在 printvector 例子 中 ， 没 有 必要 去 复制 Vector MAH 
的 元 素 。 使 用 引用 调用 (尤其 是 对 于 像 集 合 类 这 样 的 大 的 数据 结构 而 言 ) 可 以 节省 大 量 的 
执行 时 间 。 
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也 许 更 为 重要 的 是 ， 使 用 引用 调用 可 以 通过 编写 一 个 函数 来 改变 Vector 对 象 中 的 内 
容 。 例 如 ， 下 面 的 函数 在 一 个 元 素 类 型 为 整数 的 vector 对 象 中 删除 任何 零 值 元 素 : 


void removeZeroElements (Vector<int> & vec) { 
for (int i = vec.size() - 1; i >= 0; i--) { 
if (vec[i] == 0) vec.remove(i); 
) 
) 


202) 上 述 程序 中 的 for 循环 遍历 了 Vector XI vec 的 每 一 个 元 素 ， 并 且 检 查 其 元 素 值 是 否 为 
0。 如 果 其 值 为 0， 该 函数 则 调用 remove 方法 将 这 个 元 素 从 vec 中 删除 。 为 了 确保 删除 一 
个 元 素 并 不 会 改变 待 检 查 元 素 的 位 置 ， 该 for 循环 是 从 vec 的 最 后 一 个 元 素 开 始 ， 然 后 反 
向 的 检查 并 操作 元 素 。 

这 个 函数 依赖 于 引用 调用 的 使 用 。 如 果 你 忽视 函数 头 部 那 行 的 &, removeZeroElements 
将 不 会 有 效 。 函 数 中 的 代码 将 会 删除 函数 内 复制 的 vec 的 零 值 ， 并 不 是 调用 者 提供 的 
Vector 对 象 的 零 值 。 当 removeZeroElements 返回 时 ,复制 的 vec 将 会 消失 ， 导 致 原始 
Vector 对 象 的 值 并 未 改变 。 这 种 错误 很 容易 产生 ， 当 你 的 程序 出 错时 ， 你 应 该 学 会 找到 这 类 
错误 。 

图 5-1 中 的 ReverseFile 程 序 展 现 了 一 个 完整 的 C++ 程序 ， 它 使 用 Vector 
从 一 个 文件 中 以 道 序 来 显示 其 中 的 行 。 你 会 发 现 函 数 promptUserForFile 以 及 
readEntireFile 在 多 个 应 用 中 都 会 使 用 到 。 基 于 此 ， 这 两 个 函数 连同 许多 其 他 对 文件 有 
用 的 函数 ， 都 被 包含 在 filelib.h EP, 


5.1.6 创建 预先 定义 大 小 的 Vector 


你 看 到 过 的 例子 相当 于 开始 是 一 个 空 的 Vector 对 象 ， 然 后 再 逐个 地 向 其 中 添加 元 
素 。 在 许多 应 用 中 ， 每 次 创建 的 Vector 对 象 中 只 有 一 个 元 素 是 很 麻烦 的 ， 尤 其 是 你 
预先 已 经 知道 了 Vector 对 象 的 大 小 。 这 种 情况 下 ， 在 声明 部 分 指明 元 素 的 个 数 是 明 
智 的 。 

例如 ， 假 设 你 想 创建 一 个 Vector 对 象 用 来 保存 高 尔 夫 课程 上 的 18 个 洞 各 自 的 分 数 。 
你 已 经 知道 的 解决 方法 就 是 创建 一 个 空 的 vector<int>， 然 后 利用 for 循环 向 其 中 添加 
18 个 元 素 值 ， 如 下 述 代 码 所 示 : 


const int N HOLES = 18; 


Vector<int> golfScores; 

for (inti 20: ic« N HOLES; i++) { 
golfScores.add(0); 

) 


但 一 个 更 好 的 方法 就 是 将 Vector 对 象 的 大 小 作为 参数 添加 到 对 象 声 明 中 ， 如 下 所 示 ; 


Vector<int> golfScores(N HOLES); 


这 个 声明 创建 了 一 个 含有 N_HOLES 个 元 素 的 Vector WR golfScores, HF Vector 

的 基 类 型 为 nt， 每 个 初始 值 都 为 0。 这 两 段 不 同 代 码 的 功能 是 相同 的 。 每 段 代 码 都 创建 了 

一 个 包含 18 个 零 值 的 Vector<int> 对 象 。 但 第 一 段 代 码 要 求 用 户 去 初始 化 其 中 的 每 个 元 
素 ， 而 第 二 段 代 码 的 Vector 类 有 自身 初始 化 其 元 素 的 功能 。 
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* This program displays the lines of an input file in reverse order 
iy 


#include <iostream> 
#include <fstream> 
#include <string> 
#include "filelib.h" 
#include "vector .h" 
using namespace std; 


/* Function prototypes */ 
void readEntireFile(istream & is, Vector<string> & lines); 
/* Main program */ 


int main() { 
ifstream infile; 
Vector<string> lines; 
promptUserForFile(infile, "Input file: "); 
readEntireFile(infile, lines); 
infile.close(); 
for (int i - lines.size() - 1; i »- 0; i--) ( 

cout «« lines[i] «« endl; 

) 


return 0; 


Function: readEntireFile 
Usage: readEntireFile(is, lines); 


Reads the entire contents of the specified input stream into the 
string vector lines. The client is responsible for opening and 
* closing the stream. 


void readEntireFile(istream 5 is, Vector<string> & lines) { 
string line; 
while (getline(is, line)) { 
lines.add(line); 


) 
} 





图 5-1 以 逆序 显示 文件 中 每 行内 容 的 程序 


一 个 更 重要 的 例子 就 是 当 你 想 要 声明 一 个 具有 固定 大 小 的 Vector MR, SRA 5-2 中 的 程 
FP LetterEreduency， 它 的 功能 为 计算 26 个 字母 在 一 个 数据 文件 各 自 出 现 的 次 数 。 这 些 
计算 值 存储 在 变量 letterCounts 中 ， 它 以 下 述 语 句 进行 声明 : 


Vector<int> letterCounts (26); 


该 Vector 对 象 letterCounts 中 包含 的 每 个 计数 对 应 的 字母 的 顺序 和 字母 表 中 索引 

的 顺序 相同 ， 也 就 是 字母 A 的 个 数 存 储 在 letterCcounts [0] F, FÈ B 的 个 数 存 储 

在 letterCounts[1] 中 ， 以 此 类 推 。 对 于 文件 中 的 每 一 个 字母 ， 该 程序 所 做 的 就 是 在 

Vector 对 象 lettercounts 中 的 恰当 位 置 上 增加 其 相对 应 的 值 。 

这 个 恰当 位 置 是 通过 利用 字符 的 ASCII 码 值 通 过 算术 计算 获得 。 该 计算 表达 式 如 下 : 
letterCounts[toupper(ch) - 'A']++; 

用 当前 出 现 的 字符 cn 的 大 写字 母 的 字符 ASCI 码 值 减 去 字母 “RAR” 的 ASCII 码 值 就 得 

到 了 字母 表 中 ch 的 索引 。 接 着 ， 这 个 表达 式 就 更 新 了 Vector 对 象 中 该 元 素 的 计数 值 。 
接 下 来 ， 程 序 最 关心 的 就 是 以 列 对 齐 的 方式 格式 化 地 输出 文件 中 每 个 字母 的 计数 值 。 例 
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如 ， 计 算 George Eliot fj ( Middlemarch 》 中 字母 计数 结果 的 letterCounts 程序 如 下 所 示 : 


f. d uos ab Fi 
oN o ETIR = ter 





file: Middlemarch.txt 
114157 A 
23269 
34031 
61046 
166989 
30826 
30055 
89636 
99651 
1695 
11010 
56865 
37816 
96887 
108561 
21922 
1441 
79808 
88555 


«xz«aGadumwouvozziuzxrti»muounmaon"mmootu 





* This program counts the frequency of letters in a data file. 
«y 


finclude <iostream> 
#include <iomanip> 
#include <fstream> 
#include <cctype> 
#include "filelib.h" 
#include "vector.h" 
using namespace std; 


/* Constants */ 


static const int COLUMNS = 7; 


/* Main program */ 


int main() { 
Vector<int> letterCounts (26); 
ifstream infile; 
promptUserForFile(infile, "Input file: "); 
char ch; 
while (infile.get(ch)) { 
~ if (isalpha(ch)) ( 
letterCounts[toupper(ch) - 'A']++; 
) 


infile.close(); 
for (char ch = 'A'; ch <= 'Z'; cht+) { 

cout << setw(COLUMNS) << letterCounts[ch - 'A'] << " " << ch << endl; 
} 


return 0; 





图 5-2 计数 一 个 文件 中 字母 的 个 数 
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5.1.7 Vector 类 的 构造 函数 


到 目前 为 止 ， 本 章 的 示例 程序 中 声明 一 个 vector 对 象 用 了 两 种 不 同 的 方法 。 图 5-1 的 
ReverseFile 程序 采用 以 下 声明 定义 了 一 个 空 的 字符 串 向 量 : 


Vector<string> lines; 


LetterFrequency 程序 用 以 下 语句 声明 了 一 个 含有 26 CHEW Vector MR: m 
Vector<int> letterCounts (26); 206 
这 些 声明 实际 和 运行 的 行为 要 比 我 们 见 到 的 要 复杂 得 多 。 当 你 声明 一 个 基本 类 型 的 变量 

时 ， 例 如 : 


double total; 


C++ 不 会 初始 化 这 个 变量 。 内 存 习惯 于 给 这 个 变量 total 存放 一 个 该 地 址 原本 存在 的 值 ， 这 
就 导致 了 我 们 常常 得 到 一 些 不 可 预测 的 结果 。 因 此 ， 基 本 类 型 的 变量 声明 通常 包含 一 个 明确 
的 初始 化 表达 式 来 给 该 变量 设置 一 个 我 们 想 要 的 初始 值 ， 就 像 如 下 语句 : 


double total = 0.0; 


当 你 声明 一 个 变量 是 C++ 类 的 实例 的 时 候 ， 这 种 情况 就 不 一 样 了 。 在 这 种 情况 下 ，C++ A 
动 地 通过 调用 一 种 称 为 类 的 构造 函数 ( constructor) 的 特殊 方法 来 初始 化 这 个 对 象 。 例 如 以 
下 声明 : 

Vector<string> lines; 


C++ 调用 了 Vector 类 的 构造 函数 ， 该 方法 将 变量 lines 初始 化 为 一 个 属于 参数 化 类 
Vector<string> 的 空 的 Vector 对 象 。 以 下 声明 : 


Vector<int> letterCounts (26); 


调用 vector 类 的 男 一 个 构造 函数 初始 化 并 形成 了 一 个 含有 26 个 元 素 的 Vector<int> 对 象 。 

和 调用 重 载 函 数 一 样 ，C++ 的 编译 器 通过 查看 类 声明 中 构造 函数 的 参数 列表 来 决定 调 
用 类 中 哪 一 个 版 本 的 构造 函数 。1ines 变量 的 声明 没有 提供 参数 ， 这 就 告诉 编译 器 调用 
的 构造 函数 不 需要 参数 ， 通 常 我 们 称 这 种 构造 函数 为 默认 构造 函数 ( default constructor) 
letterCounts 变量 的 声明 提供 了 一 个 整 型 参数 ， 它 告诉 编译 器 调用 含有 一 个 整数 来 指明 
Vector 对 象 大 小 的 构造 函数 。Vector 类 中 这 两 种 版 本 的 构造 函数 连同 Vector 的 其 他 方 
法 列 于 表 5-1 中 。 

如 果 你 认真 阅读 了 表 5-1 构造 函数 的 描述 ， 你 会 发 现 第 二 种 形式 的 构造 函数 接受 一 个 
可 选择 的 参数 来 指明 每 个 元 素 的 初始 值 。 在 那些 元 素 初始 值 为 基本 类 型 的 默认 值 ( default 
value) 的 场景 中 ， 这 个 参数 通常 被 省 略 ， 例 如 数值 类 型 的 初始 值 是 0，bool 类 型 的 初始 值 
是 false, char 类 型 的 初始 值 是 ASCII 码 值 为 0 所 对 应 的 那个 字符 。 对 于 类 而 言 ， 默 认 值 
是 通过 调用 默认 构造 函数 来 确定 的 。 


表 5-1 Vector .h 接口 中 的 条 目 


构造 函数 







Vector«type» () 创建 一 个 空 的 Vector WH 


创建 一 个 含有 nn 个 元 素 的 Vector 对 象 ， 每 个 元 素 都 被 初始 化 为 value， 
如 果 value LEAR, M value 类 型 的 默认 值 








Vector<type> (n, value) ; 
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方法 
size() 


isEmpty () 


get (index) 


set (index, value) 


add (value) 
insertAt (index, value) 
removeAt (index) 


clear() 
操作 符 
vec [index] 


Vi + v2 


vec += el Cay 


B 
tA 
* 


返回 Vector 对 象 中 元 素 的 个 数 
若 Vector 对 象 为 室 ， 返 回 true 


返回 指定 索引 位 置 index 的 元 素 。 尝 试 获取 Vector 对 象 边 界外 的 元 素 会 
发 生 错误 


给 指定 位 置 index 的 元 素 设 置 新 的 值 value。 尝 试 给 Vector 对 象 边 界外 
的 元 素 设置 新 值 会 发 生 错误 


在 Vector 对 象 的 尾部 添加 一 个 新 的 元 素 value 
在 指定 位 置 index 之 前 插入 一 个 新 值 value 

删除 指定 位 置 index 上 的 元 素 

删除 vector 对 象 中 的 所 有 元 素 


查找 指定 位 置 index 上 的 元 素 。 尝 试 获取 Vector 对 象 边界 外 的 元 素 会 发 
生 错 误 


连接 w 和 v,， 返 回 一 个 包含 vi A v 中 的 所 有 元 素 的 Vector MR 
在 Vector 对 象 的 尾部 添加 元 素 ei, es 等 





5.1.8 Vector 中 的 操作 符 


除 表 5-1 所 列 的 方法 之 外 ，Vector 类 也 定义 了 一 些 适 用 于 Vector 对 象 的 操作 符 。 你 
已 经 见 过 方 括号 的 使 用 了 ， 这 使 得 利用 数组 的 传统 的 查找 方法 从 一 个 Vector 对 象 中 查找 
元 素 变 为 可 能 。Vector 类 还 定义 了 操作 符 + 和 += 作为 连接 两 个 Vector 对 象 和 在 一 个 已 
经 存在 的 Vector 对 象 的 尾部 添加 元 素 的 简洁 形式 。 

Vector 对 象 中 的 + 操作 符 与 其 在 字符 串 中 的 使 用 相同 。 如 果 Vector 类 的 基 类 型 为 
字符 ， 字 符 向 量 v1 、v2 包含 的 值 为 : 


计算 表达 式 v1+v2， 将 产生 一 个 新 的 含有 五 个 元 素 的 Vector 对 象 ， 如 下 所 示 : 


0 1 2 3 4 


+= 操作 符 把 元 素 添 加 到 一 个 已 经 存在 的 Vector 对 象 的 结尾 处 ， 但 是 它 在 初始 化 一 个 
Vector 对 象 的 内 容 时 也 很 有 用 。 例 如 ， 你 可 以 声明 和 初始 化 一 个 Vector 对 象 v1， 如 下 所 示 : 


Vector<char> v1; 


vl += tA’, "ue". "Gs 
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如 果 你 使 用 2011 年 新 颁布 的 C++ 新 标准 C++11， 你 可 以 简化 这 个 初始 化 ， 如 下 所 示 : 


Vector<char> vil = ( 'A', "B, "or j; 
5.1.9 表示 二 维 结构 

在 Vector 类 中 的 基 类 型 参数 可 以 是 任意 的 C++ 类型， 甚至 可 以 是 该 模版 类 本 身 。 特 
别 是 你 可 以 通过 声明 一 个 基 类 型 为 Vector 类 型 本 身 的 Vector 对 象 来 创建 一 个 二 维 结构 
HJ vectors D FEH; 


Vector< Vector<int> > sudoku(9, Vector<int>(9)); 


将 变量 sudoku 初始 化 为 一 个 含有 九 个 元 素 的 Vector 对 象 ， 其 中 每 个 元 素 又 都 是 含有 九 
个 元 素 的 Vector 对 象 。 内 部 的 Vector 对 象 的 基 类 型 为 int, SRH Vector 对 象 的 基 
类 型 是 Vector<int>。 整 个 集合 的 类 型 是 


Vector< Vector<int> > 209 
, 


尽管 某 些 C++ s PE dit TE AS Wt Hb RED E Pe SR BU ZH] JEFE ERU, [Hx Rp] D 
C++ 标准 ， 即 在 内 部 类 型 参数 周围 留 有 空间 。 这 个 空间 确保 了 尖 括 号 中 类 型 参数 被 正确 的 解 
释 。 如 果 你 用 下 面 的 声明 代替 上 面 的 声明 : 


Vector<Vector<int>> sudoku(9, Vector<int>(9)); 5h 


许多 C++ 编译 顺 会 将 “>> ”解释 为 一 个 单个 的 操作 符 ， 并 且 不 能 编译 通过 这 一 代码 行 。 


5.1.10 Stanford 类 库 中 的 Grid 类 


RAS EAE Vector 对 象 能 够 代表 二 维 结构 ， 但 这 种 方法 很 不 便利 。 为 了 简化 那 
些 需要 二 维 结构 的 应 用 开发 ，Stanford 集合 类 库 提 供 了 一 种 名 为 Grid 的 类 ， 尽 管 在 标准 模 
板 库 中 并 没有 对 应 的 类 。grid.h 中 的 条 目 如 表 5-2 所 示 。 
表 5-2 grid.h 接口 中 的 条 目 

构造 函数 

创建 一 个 空 的 grid 对象。 那些 使 用 默认 构造 函数 的 用 户 需要 通过 调用 
resize 方法 指定 grid 对 象 的 维 数 

创建 一 个 指定 具体 行 数 和 列 数 的 grid 对 象 。 其 中 每 个 元 素 被 初始 化 为 元 
素 类 型 的 默认 值 


Grid<type>() 


Grid<type> (rows, cols) 





方法 
numRows () 返回 grid 对 象 中 的 水 平行 数 
numCols () 返回 grid 对 象 中 的 垂直 列 数 
inBounds (row, col) 如 果 指 定 的 行 和 列 组 成 的 坐标 在 grid HRF, RE true 
get (row, col) 返回 grid 对 象 中 指定 的 行 和 列 所 在 的 元 素 
set (row, col, value) 给 指定 坐标 位 置 上 的 元 素 设 置 新 的 值 value 
a uM 通过 给 定 的 行 数 rows 以 及 列 数 cols 来 改变 grid 对 象 的 尺寸 。grid 对 象 中 
先前 的 内 容 都 被 丢弃 


操作 符 


grid [row] [col] | 在 grid 对 象 中 查找 指定 行 和 列 所 在 的 元 素 210 


5.2 Stack 类 


依据 集合 类 所 支持 的 方法 来 进行 评估 ， 最 简单 的 集合 类 就 是 stack 类 ， 由 于 它 的 简单 
性 ， 使 得 它 在 很 多 程序 应 用 中 非常 有 用 。 从 概念 上 讲 ， 一 个 栈 (stack) 提供 了 数据 值 集 合 的 
存储 ， 并 且 删 除 一 个 栈 中 的 值 的 方向 必须 要 和 值 添加 进来 的 方向 相反 。 这 就 告诉 我 们 最 后 一 
个 添加 进来 的 值 总 是 第 一 个 被 删除 。 

由 于 栈 在 计算 机 科学 中 的 重要 作用 ， 故 它 有 自己 的 术语 。 向 一 个 栈 中 添加 一 个 新 的 元 素 
被 称 为 入 栈 (push)， 从 栈 中 删除 最 近 的 元 素 称 为 出 栈 (pop)。 此 外 ， 栈 中 处 理 的 顺序 有 时 候 
被 称 为 LIFO (Last In First Out)， 它 表示 “后 进 先 出 ”。 

词语 “ 栈 ”"、“ 入 栈 ” 以 及 “出 栈 ” 的 一 种 常见 的 (可 能 是 假 的 ) 解释 就 是 栈 模型 继承 于 
咖啡 馆 的 盘子 存储 方式 。 如 果 你 在 一 个 咖啡 馆 中 ， 那 里 的 客人 在 一 个 自助 的 流水 线 的 开始 处 
拿 起 他 的 盘子 ， 这 些 盘 子 用 弹簧 顶 住 被 排 成 一 列 ， 使 得 客人 能 够 方便 地 拿 到 最 上 面 的 盘子 ， 
如 下 图 所 示 : 





当 洗 碗 工 添 加 新 盘子 时 ， 将 它 放 在 盘子 的 最 上 面 ， 随 着 弹簧 被 压缩 ， 其 他 的 盘子 轻微 地 下 
降 ， 如 下 图 所 示 : 





客人 们 只 能 拿 到 最 上 面 的 盘子 。 当 他 们 拿 走 盘子 后 ， 剩 下 的 盘子 将 会 上 升 。 最 后 一 个 添加 进 
来 的 盘子 是 第 一 个 被 客人 拿 走 的 。 
栈 对 于 编程 很 重要 的 一 个 基本 原因 就 是 : 函数 嵌 套 调用 如 同 栈 的 操作 。 例 如 : 如 果 主 函 
数 调用 了 一 个 名 为 f 的 函数 ,f AAW (stack frame) 将 会 添加 进 main 函数 的 栈 帧 中 的 
顶端 ， 如 下 图 所 示 : 


void f()( 
ey cout << "This is the function f" << endl; 





如 果 f 调 用 g，g 的 一 个 新 的 栈 帧 将 会 添加 进 了 的 栈 帧 的 顶端 ， 如 下 图 所 示 : 


void g() { 


U| || cout << "This is the function g" << endl; 
) 
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当 g 返 回 时 ， 它 的 栈 帧 从 栈 中 弹出 ， 将 下 恢复 到 栈 顶 ， 如 原 图 所 示 。 


5.2.1 Stack 类 结构 


Al Vector 类 以 及 Grid 类 一 样 ，Stack 类 也 是 一 个 需要 指明 元 素 类 型 的 集合 类 。 例 
ll, Stack<int> 代表 了 一 个 元 素 类 型 为 整 型 的 栈 ， Stack«string» 代表 了 一 个 元 素 类 
型 为 字符 串 的 栈 。 类 似 地 ， 如 果 你 定义 了 类 Plate 以 及 Frame， 你 可 以 使 用 这 些 类 的 对 
象 作为 元 素来 创建 Stack<Plate> 和 Stack<Frame> WR. stack.h 中 的 条 目 如 表 5-3 
所 示 。 


表 5-3 stack.h 接口 中 的 条 目 


构造 函数 
方法 
size() 返回 当前 栈 中 的 元 素 个 数 
isEmpty () 如 果 栈 为 空 ， 则 返回 true 
push (value) 将 值 value EARR Di 
pop () Nia 并 且 将 栈 顶 元 素 返 回 给 调用 者 。 在 空 栈 中 调用 pop 方法 会 产 
peek () 返回 栈 顶 元 素 的 值 但 并 不 出 栈 。 在 空 栈 中 调用 peek 方法 会 产生 错误 
clear () 删除 栈 中 的 所 有 元 素 


5.2.2” 栈 和 小 型 计算 器 


栈 一 个 最 有 趣 的 应 用 就 是 电子 计算 器 ， 它 被 用 来 存储 计算 的 中 间 结 果 。 尽 管 栈 在 大 多 
数 计算 器 的 操作 中 扮演 了 一 个 核心 角色 ， 但 是 在 那些 需要 用 户 输 入 逆 波 兰 表 示 法 (reverse 
Polish notation, RPN) 的 早期 科学 计算 器 中 能 很 明显 地 看 到 栈 的 作用 。 

在 道 波兰 表示 法 中 ， 操 作 符 在 那些 它们 作用 的 操作 数 之 后 输入 。 例 如 ， 为 了 用 逆 波 兰 式 
计算 器 计算 表达 式 


B.5 * 4.4 * 6.9 / 1.5 


的 结果 ， 你 将 会 按照 下 面 的 顺序 输入 操作 数 和 操作 符 : 


8.5 4.4 C) 6.9 1.5 (7) (+) 


当 按 下 ENTER 按钮 时 ， 计 算 器 获得 了 先前 的 值 并 将 该 值 压 人 栈 。 当 按 下 操作 符 按 钮 
时 ,计算 器 首先 会 检查 用 户 是 否 已 经 输入 了 一 个 值 ， 如 果 已 经 输入 了 ， 那 么 会 自动 地 将 其 从 
栈 中 弹出 。 然 后 通过 以 下 步骤 计算 应 用 操作 符 的 结果 : 

e 从 栈 顶 弹出 两 个 值 。 

e 对 这 些 值 进行 由 按钮 所 指定 的 算术 操作 。 

© 将 结果 压 回 到 栈 。 
除了 当 用 户 在 输入 数值 时 ， 计 算 器 总 是 显示 栈 项 的 值 。 因 此 ， 图 5-3 显示 了 在 计算 中 的 每 一 
时 刻 ， 计 算 器 所 显示 的 内 容 以 及 栈 中 所 包含 的 值 。 
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用 C++ 实现 逆 波 兰 式 计算 器 需要 在 用 户 接 口 设计 上 做 出 一 些 改变 。 在 一 个 真正 的 计算 
arf, sade gg ee me 在 这 种 实现 方法 下 ， 我 们 可 以 很 简单 的 想象 用 户 
在 命令 行 中 输入 的 每 一 行 ， 并 且 这 些 行内 容 的 形式 有 以 下 几 种 : 

e 一 个 浮 点 数 。 

e 一 个 从 +、-、* 和 / 中 选 出 的 算术 操作 符 。 

e 字母 0， 它 的 作用 是 终止 程序 。 

e 字母 H， 它 的 作用 是 输出 帮助 消息 。 

e 字母 Cc， 它 的 作用 是 消除 当前 栈 中 所 有 的 值 。 

一 个 正在 运行 的 计算 器 程序 的 例子 如 下 图 所 示 : 


(A0: " RPNGelculator. . 、 iui ania 
RPN Calculator Simulation (type H for help) 
>H 


Enter expressions in Reverse Polish Notation, 

in which operators follow the operands to which 
they . Each line consists of a number, an 
operator, or one of the following commands: 


Veavevyvuvey 
© toxta »avnmo 


N 





由 于 用 户 以 RETURN 键 作 为 每 一 个 数字 输入 的 结束 ， 并 且 它 只 是 表明 一 个 数字 输入 完成 ， 
因此 没有 必要 对 RETURN 按钮 做 一 个 副本 。 当 用 户 输入 数字 时 ， 计 算 器 程序 仅仅 是 将 这 些 
数字 添加 到 栈 中 。 当 计算 器 读 到 一 个 操作 符 时 ， 它 会 弹出 栈 顶 的 两 个 元 素 ， 再 基于 操作 符 计 
算出 结果 ， 并 且 展 示 这 个 结果 ， 最 后 再 将 结果 压 人 栈 。 

214 图 5-4 是 计算 器 应 用 的 完整 的 实现 方法 。 





图 5-4 实现 一 个 简单 的 RNP 计算 器 程序 


This program simulates an electronic calculator that uses 
reverse Polish notation, in which the operators come after 
the operands to which they apply. Information for users 
of this application appears in the helpCommand function. 


/ 


#include <iostream> 
#ainclude <cctype> 
#include <string> 
#anclude "error.h" 
#include "simpio.h" 
#include "stack.h" 
#include "strlib.h" 
using namespace std; 


/* Function prototypes */ 


void applyOperator(char op, Stack<double> & operandStack) ; 
void helpCommand(); 


/* Main program */ 


int main() ( 
cout << "RPN Calculator Simulation (type H for help)" << endl; 
Stack«double» operandStack; 
while (true) ( 
string line - getLine("» "); 
if (line.length() == 0) line = "Q"; 
char ch - toupper(line[0]); 
if (ch -- 'Q') ( 
break; 
else if (ch == 'C') { 
operandStack.clear(); 
else if (ch == 'H') { 
helpCommand(); 
else if (isdigit(ch)) ( 
operandStack .push (stringToReal (line) ) ; 
else { 
applyOperator(ch, operandStack) ; 
} 
) 


return 0; 


Function: applyOperator 
Usage: applyOperator(op, operandStack) ; 


Applies the operator to the top two elements on the operand stack. 
Because the elements on the stack are popped in reverse order, 
the right operand is popped before the left operand. 

#7 


void applyOperator(char op, Stack«double» & operandStack) ( 
double result; 
double rhs = operandStack.pop(); 
double lhs = operandStack.pop(); 
switch (op) ( 
case ‘+': result = lhs 


* rhs; break; 
case '—-': result = lhs - rhs; break; 
case '*': result = lhs + rhs; break; 
case '/': result - lhs / rhs; break; 
default:  error("Illegal operator"); 
) 


cout «« result «« endl; 
operandStack.push (result); 


Function: helpCommand 
Usage: helpCommand(); 
* 


Generates a help message for the user. 


*/ 
void helpCommand() { 


图 5-4 ( 续 ) 
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"Enter expressions in Reverse Polish Notation," << endl; 
"in which operators follow the operands to which" << endl; 
"they apply. Each line consists of a number, an" << endl; 
“operator, or one of the following commands:" << endl; 


" Q —- Quit the program" << endl; 
" H — Display this help message" << endl; 
" C -- Clear the calculator stack" << endl; 





图 5-4 (£X) 


5.3 Queue 类 


正如 你 在 5.2 节 所 学 过 的 ， 栈 的 典型 特点 就 是 最 后 输入 的 总 是 最 先 输出 。 并 强调 了 这 
种 行为 经 常 在 计算 机 科学 中 作为 LIFO 被 提 到 ， 其 中 LIFO 是 短语 “ last in, first out” WE 
字母 缩写 。LIFO 原则 在 编程 环境 中 非常 有 用 ， 因 为 它 反映 了 函数 的 调用 操作 ， 最 近 调 用 
的 函数 总 是 最 先 返回 。 然 而 ， 在 现实 社会 中 ,“1last in, first out” 模 型 相对 来 说 很 少 。 实 际 
上 ， 在 人 类 社会 中 ， 我 们 集体 的 公平 的 分 配 表示 法 被 表达 成 为 “ 先 来 先 被 服务 〈first come, 
first served)”。 在 编程 中 ， 这 种 顺序 策略 的 短语 是 “先进 先 出 (first in, first out)”， 习 惯 上 简 
写 为 FIFO。 

一 个 使 用 FIFO 原则 存储 数据 的 数据 结构 被 称 为 队列 ( queue)。 队 列 基本 的 操作 (和 栈 
的 操作 push 以 及 pop FAW) 被 称 为 入 队 (enqueue) 和 出 队 (dequeue)。 人 和 信 队 操作 在 队列 的 
最 后 添加 一 个 新 元 素 ， 通 常 被 称 之 为 队 尾 (tail)， 出 队 操作 删除 队列 开头 的 元 素 ， 通 常 被 称 
之 为 队 首 (head). 

栈 和 队列 结构 之 间 的 差异 可 以 用 下 图 简单 地 阐明 。 在 一 个 栈 中 ， 用户 必 须 在 数据 结构 的 
同一 端 〈 栈 顶 ) 添加 和 删除 元 素 ， 如 下 图 所 示 : 


Push 


RE 
pop 


在 队列 中 ， 用 户 在 一 端 添 加 元 素 而 在 另 一 端 删除 元 素 ， 如 下 图 所 示 : 


enqueue 


» ATI 
队 首 队 尾 


dequeue 


可 能 和 你 期 望 的 一 样 ， 上 述 模型 是 非常 熟悉 的 ，Queue 类 看 起 来 非常 像 Stack 类 的 一 
个 对 应 物 。 表 5-4 的 条 目 证 实 了 这 个 假定 。 它 们 只 在 术语 上 存在 差异 ， 它 反映 了 元 素 顺 序 的 
不 同 。 

表 5-4 queue .h 接口 中 的 条 目 
构造 函数 
Queue<type> () 创建 一 个 空 的 能 存储 指定 类 型 值 的 队列 对 象 
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(2) 

方法 

size() 返回 当前 队列 中 元 素 的 个 数 

isEmpty () 若 队列 为 空 ， 则 返回 true 

enqueue (value) 将 值 value 添加 到 队 尾 

dequeue () 删除 队 首 元 素 并 将 此 元 素 返 回 给 调用 者 。 在 空 队列 中 调用 dequeue 方法 将 产生 错误 

Peek () 返回 队 首 元 素 的 值 但 并 不 将 其 从 队列 中 删除 。 在 空 队 列 中 调用 Peek 方法 将 产生 错误 

clear () 删除 队列 中 的 所 有 元 素 


队列 这 种 数据 结构 在 编程 中 有 很 多 应 用 。 队 列 出 现在 很 多 以 确保 服务 能 够 被 公正 对 待 为 
目的 的 先进 - 先 出 原则 的 场景 中 。 例 如 ， 如 果 你 的 工作 环境 中 只 有 一 台 打 印 机 可 共享 给 多 台 
电脑 ， 那 么 打印 软件 被 设计 成 所 有 的 打印 请 求 都 将 进入 一 个 队列 。 因 此 ， 如 果 几 个 用 户 决 定 
输入 打印 请 求 ， 队 列 结构 能 确保 每 个 用 户 的 请 求 按照 收 到 的 请 求 的 顺序 执行 。 

程序 中 出 现 的 队列 大 多 数 都 是 相同 的 ， 它 们 都 是 模仿 排队 的 行为 。 例 如 ， 如 果 你 想 要 决 
定 一 个 超市 里 面 需要 多 少 个 收银 员 。 那 么 通过 编写 一 个 程序 来 模拟 顾客 在 商店 中 的 行为 是 值 
得 的 。 这 样 的 一 个 程序 基本 上 会 涉及 队列 ， 因 为 一 个 结账 台 是 以 先进 - 先 出 这 种 方式 进行 
的 。 那 些 完成 购物 的 顾客 们 进入 结账 队列 中 等 待 付 账 。 每 一 个 顾客 最 终 到 达 队 列 的 前 端 ， 在 
这 里 收银 员 计 算 总 的 付款 金额 然后 收 钱 。 模 拟 的 这 个 行为 代表 了 应 用 程序 的 一 个 重要 类 ， 它 
值得 花费 一 些 时 间 来 理解 这 个 模拟 是 如 何 工作 的 。 


5.8.1 仿真 和 模型 


在 编程 世界 之 外 ， 真 实 世 界 中 有 永 无 止境 的 事情 和 过 程 (尽管 它们 的 确 都 很 重要 )， 它 
们 都 太 复杂 了 以 致 于 难以 理解 。 例 如 ， 知 道 各 种 污染 物 是 如 何 影 响 臭 氧 层 以 及 臭氧 层 改 变 时 
如 何 影响 全 球 气候 是 非常 有 用 的 。 类 似 地 ， 如 果 经 济 学 家 和 政治 领导 人 对 国家 经 济 是 如 何 运 
转 的 有 一 个 更 加 全 面 准 确 的 理解 ， 他 们 将 能 够 对 降低 资本 利益 税 是 刺激 投资 还 是 加 剧 已 经 存 
在 的 贫 富 差距 做 出 评估 。 

当 遇 到 像 这 样 的 大 规模 问题 时 ， 通常 给 出 一 个 理想 的 能 够 代表 简化 的 真实 世界 过 程 的 模 
型 是 必要 的 。 大 多 数 问题 都 太 复杂 了 以 至 于 无 法 完全 理解 ， 这 些 问 题 都 有 太 多 的 细节 。 构 建 
一 个 模型 的 主要 原因 在 于 : 除了 特定 问题 的 复杂 性 外 ， 我 们 能 够 在 没有 影响 这 个 问题 的 基本 
特性 的 前 提 下 做 出 一 些 必然 的 假设 来 帮助 你 简化 一 个 复杂 的 过 程 。 对 于 一 个 过 程 可 以 想 出 一 
个 合理 的 模型 ， 你 可 以 把 这 个 模型 动态 地 翻译 成 能 够 捕获 该 模型 的 行为 的 程序 。 这 样 的 程序 
称 为 仿真 (simulation ) 。 

创建 一 个 仿真 通常 由 两 个 步骤 组 成 ， 记 住 这 一 点 很 重要 。 第 一 个 步骤 是 设计 一 个 概念 模 
型 ， 用 来 仿真 真实 世界 中 的 行为 。 第 二 个 步骤 是 编写 一 个 能 够 实现 这 个 概念 模型 的 程序 。 这 
两 个 步骤 可 能 都 会 发 生 错误 ， 因 此 保持 对 仿真 以 及 它们 在 真实 世界 中 的 适用 性 的 怀疑 是 明智 
的 。 在 现实 社会 中 ， 计 算 机 提供 的 “结果 ”只 在 一 定 条 件 下 才 可 以 相信 ， 认 识 到 仿真 永远 比 
不 上 它们 所 基于 的 模型 是 至 关 重 要 的 。 


5.89.2 ”排队 模型 


假设 你 想 设计 一 个 超市 排队 行为 模型 的 仿真 。 通 过 模拟 排队 ， 你 可 以 得 到 一 些 有 用 的 排 
队 模 型 的 性 质 ， 并 且 这 些 性 质 可 能 会 帮助 公司 作出 决策 。 例 如 需要 多 少 个 收银 员 以 及 需要 给 
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队列 提供 多 大 的 空间 等 。 

在 编写 一 个 结账 队列 仿真 的 过 程 中 ， 第 一 步 是 开发 出 一 个 排队 模型 ， 在 这 个 模型 中 你 可 
以 确定 任何 简化 的 假设 。 例如， 为 了 使 这 个 仿真 最 初 的 实现 尽 可 能 的 简单 ， 你 可 以 假设 这 里 
只 有 一 个 收银 员 只 为 一 个 队列 进行 服务 ， 且 顾客 随机 过 来 排队 。 每 当 收 银 员 空闲 ， 并 且 队 列 
里 面 还 有 人 ， 收 银 员 就 开始 为 那个 顾客 服务 。 在 经 过 一 个 适当 的 服务 时 期 (这 在 某 种 程度 上 
需要 建 模 )， 收 银 员 完成 了 当前 的 交易 ， 接 着 为 队列 中 的 下 一 个 顾客 服务 。 


5.3.3 ”离散 时 间 


模型 中 男 一 个 经 常用 到 的 假设 就 是 对 精确 度 等 级 的 限制 。 在 仿真 结账 队列 时 ,收银 员 服 
务 一 个 顾客 所 花费 的 时 间 在 一 定 限度 内 是 不 断 变 化 的 。 一 个 顾客 可 能 要 花费 两 分 钟 ， 男 一 个 
顾客 可 能 要 花费 六 分 钟 。 然 而 ， 考 虑 用 分 钟 数 来 衡量 时 间 是 否 让 仿真 变 得 充分 地 精确 ， 这 是 
非常 重要 的 。 如 果 你 有 一 个 非常 精确 的 秒表 ， 你 可 能 会 发 现 一 个 顾客 花费 了 3.141 592 65 分 
钟 。 你 需要 解决 的 问题 是 你 需要 什么 样 的 精度 。 

对 于 大 多 数 模 型 而 言 ， 尤 其 是 这 些 打算 作为 仿真 的 模型 来 说 ， 引 入 一 个 简化 的 假设 是 
非常 有 用 的 ， 即 模型 中 所 有 事件 发 生 的 时 间 都 是 离散 的 整数 时 间 。 假 设 你 能 找到 一 个 单位 时 
间 〈 建 模 的 目的 ) 并 使 用 它 ， 那 么 你 可 以 将 其 看 成 是 不 可 分 割 的 。 总 之 ， 在 一 个 仿真 中 用 到 
的 单位 时 间 一 定 要 足够 小 ， 以 至 于 在 一 个 单个 的 时 间 单 元 中 发 生 超 过 一 个 事件 的 可 能 性 是 
可 以 忽略 的 。 例 如 ， 在 结账 队列 仿真 中 ， 分 钟 可 能 不 够 精确 ， 两 个 顾客 很 有 可 能 在 同一 分 钟 
内 到 达 。 但 是 ， 你 可 以 使 用 秒 作为 单位 时 间 以 降低 两 个 顾客 在 同一 秒 钟 内 恰好 同时 到 达 的 可 
能 性 。 

接 下 来 的 章节 将 采取 用 秒 作为 度量 时 间 的 策略 。 然 而 ,没有 理由 要 你 必须 用 传统 的 时 间 
单位 来 度量 时 间 。 当 你 编写 一 个 仿真 程序 时 ， 你 可 以 定义 任何 适合 模型 结构 的 单位 时 间 。 例 
如 ， 你 可 以 定义 五 秒 钟 为 一 个 单位 时 间 ， 然 后 在 一 系列 五 秒 的 时 间 间 隔 中 运行 仿真 。 


5.3.4 仿真 时 间 中 的 事件 


使 用 离散 时 间 单 位 的 一 个 优点 是 可 以 使 用 int 类 型 变量 而 不 是 采用 较 低 效 的 double 
类 型 变量 。 使 用 离散 时 间 单 位 的 另 一 个 更 为 重要 的 优点 是 它 允 许 你 把 仿真 结构 作为 一 个 循 
环 ， 而 每 个 时 间 单 元 代表 其 中 的 一 次 单独 的 循环 。 当 你 用 这 种 方法 处 理 问 题 时 ， 仿 真 程序 可 
能 具有 如 下 形式 : 


for (int time = 0; time < SIMULATION TIME; time++) ( 
Execute one cycle of the simulation. 


) 
在 上 述 循环 体内 ， 程 序 在 一 个 仿真 单位 时 间 内 执行 必要 的 操作 。 

思考 一 下 在 结账 队列 仿真 中 的 每 个 单位 时 间 可 能 发 生 的 事件 。 一 种 可 能 就 是 一 个 新 的 
顾客 到 达 。 另 一 种 可 能 就 是 收银 员 完成 了 对 当前 顾客 的 服务 ， 然 后 再 去 为 队列 中 的 下 一 个 顾 
客服 务 。 这 些 事件 带 来 了 一 些 有 趣 的 问题 。 为 了 完成 这 个 模型 ， 你 需要 知道 顾客 多 久 来 一 次 
以 及 他 们 在 收银 机 前 所 花费 的 时 间 。 你 可 以 通过 观察 商店 中 真实 的 结账 队列 来 收集 近似 的 信 
息 。 即 使 你 收集 了 这 些 信 息 ， 你 仍然 需要 对 这 些 信息 进行 简化 : 包含 足够 多 的 真实 世界 中 的 
行为 是 有 用 ， 并 且 就 这 个 模型 来 说 它 是 易于 理解 的 。 例 如 ， 你 的 调查 表明 顾客 平均 每 隔 20 
秒 就 有 一 人 进入 队列 。 对 于 这 个 模型 的 输入 来 说 ， 这 个 平均 的 到 达 率 是 非常 有 用 的 。 另 一 方 
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面 ， 你 可 能 对 每 隔 20 秒 就 有 一 个 顾客 到 达 的 仿真 不 是 很 有 信心 。 这 样 的 实现 可 能 会 违反 真 
实 世 界 中 顾客 到 达 是 随机 的 情况 ， 以 及 他 们 经 常 是 同时 到 达 的 情况 。 

由 于 上 述 原 因 ， 到 达 过 程 通常 以 指定 在 任意 的 一 个 离散 的 单位 时 间 内 顾客 到 达 的 概率 
建 模 ， 而 不 是 根据 到 达 者 之 间 的 平均 时 间 来 进行 建 模 。 例 如 ， 如 果 你 的 研究 表明 : 每 隔 20 
秒 有 一 个 顾客 到 达 ， 那么 在 任何 一 秘 钟 顾客 到 达 的 平均 概率 是 1/20 或 者 0.05。 如 果 假 设 
在 每 一 个 单位 时 间 内 顾客 以 等 概率 到 达 ， 那 么 到 达 模 型 就 形成 了 一 种 模式 ， 这 种 模式 以 法 
国 数学 家 Siméon Poisson (1781 ~ 1840) 的 名 字 命名 ， 被 数学 家 称 为 泊 松 分 布 (Poisson 
distribution ) 。 

你 可 能 还 会 选择 对 收银 员 为 一 个 顾客 服务 多 长 时 间 做 出 一 个 简化 的 假设 。 例 如 ， 如 果 你 
假设 每 个 顾客 所 需 的 服务 时 间 在 一 定 范围 内 是 分 布 均匀 的 ， 那么 这 个 程序 将 很 容易 编写 。 如 
果 你 那样 做 的 话 ， 你 可 以 从 random.h 接口 使 用 randomInteger 国 数 来 选择 服务 时 间 。 


5.3.5 “实现 仿真 

即使 这 个 程序 比 本 章 其 他 程序 要 长 ， 但 是 这 个 程序 代码 更 易于 编写 。 图 5-5 给 出 了 程序 
CheckoutLine 的 代码 。 该 仿真 的 核心 是 一 个 循环 ， 它 根据 参数 SIMULATION TIME 所 
指定 的 秒 的 数量 来 运行 。 每 一 秒 ， 该 仿真 都 会 完成 下 面 的 操作 : 

1. 检查 是 否 有 顾客 到 达 ， 如 果 有 的 话 ， 那 么 将 该 顾客 加 入 到 队列 中 。 

2. 如 果 收 银 员 当前 处 于 服务 状态 ,提示 收银 员 还 需要 为 当前 的 顾客 服务 多 长 时 间 。 最 
终 ， 这 个 要 求 服务 的 时 间 结 束 ， 收 银 员 变 为 空闲 。 

3. 如 果 收 银 员 是 空闲 的 ， 将 会 为 队列 中 的 下 一 个 顾客 服务 。 


~ 
* 


* 


File: CheckoutLine. cpp 


* 


This program simulates a checkout line, such as one you 
might encounter in a grocery store. Customers arrive at 
the checkout stand and get in line. Those customers wait 
in the line until the cashier is free, at which point 
they are served and occupy the cashier for some period 

of time. After the service time is complete, the cashier 
is free to serve the next customer in the line. 


In each unit of time, up to the constant SIMULATION TIME, 
the following operations are performed: 


*o*k o*» *? » » © » *X * 


1. Determine whether a new customer has arrived. 
New customers arrive randomly, with a probability 
determined by the constant ARRIVAL PROBABILITY. 


. If the cashier is busy, note that the cashier has 
spent another minute with that customer. Eventually, 
the customer's time request is satisfied, which frees 
the cashier. 


. If the cashier is free, serve the next customer in line 
The service time is taken to be a random period between 
MIN SERVICE TIME and MAX SERVICE TIME. 


At the end of the simulation, the program displays the 
simulation constants and the following computed results: 


o The number of customers served 
o The average time spent in line 
o The average number of people in line 


/ 


* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 








图 5-5 仿真 结账 队列 程序 
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#include <iostream> 
#include <iomanip> 
#ainclude "queue.h" 
#include "random.h" 
using namespace std; 


/* Constants */ 


const double ARRIVAL_PROBABILITY = 0.05; 
const int MIN_SERVICE_TIME = 5; 

const int MAX_SERVICE_TIME = 15; 

const int SIMULATION_TIME = 2000; 


/* Function prototypes */ 


void runSimulation(int & nServed, int & totalWait, int & totalLength) ; 
void printReport (int nServed, int totalWait, int totalLength) ; 


/* Main program */ 


int main () 


{ 


int nServed; 

int totalWait; 

int totalLength; 

runSimulation(nServed, totalWait, totalLength) ; 
printReport (nServed, totalWait, totalLength) ; 
return 0; 


Function: runSimulation 
Usage: runSimulation(); 


Runs the actual simulation. This function returns the results 
of the simulation through the reference parameters, which record 
the number of customers served, the total number of seconds that 


custome 
in each 


rs were waiting in a queue, and the sum of the queue length 
time step. 


void runSimulation(int & nServed, int & totalWait, int & totalLength) ( 
Queue<int> queue; 
int timeRemaining - 0; 


nServed 


= 0; 


totalWait = 0; 
totalLength = 0; 
for (int t = 0; t < SIMULATION TIME; t++) ( 
if (randomChance (ARRIVAL PROBABILITY)) ( 
queue.enqueue (t) ; 


) 

if (timeRemaining > 0) ( 
timeRemaining--; 

) eise if (!queue.isEmpty()) ( 
totalWait += t — queue.dequeue(); 
nServed++; 
timeRemaining = randomInteger (MIN SERVICE TIME, MAX SERVICE TIME); 


) 


totalLength += queue.size(); 


Functio 
Usage: 


* Reports 
*7 


void print 
cout «« 

<< 

cout << 
cout << 

<< 

cout << 

<< 

cout << 


n: printReport 
printReport (nServed, totalWait, totalLength); 


the results of the simulation in tabular format 


Report (int nServed, int totalWait, int totalLength) { 
"Simulation results given the following constants:" 
endl; 
fixed << setprecision (2); 

" SIMULATION TIME: " «« setw(4) 
SIMULATION TIME «« endl; 

" ARRIVAL PROBABILITY: " «« setw(7) 
ARRIVAL PROBABILITY «« endl; 

" MIN SERVICE TIME: " << setw(4) 


图 5-5 (48) 
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<< MIN SERVICE TIME «« endl; 
cout «« " MAX SERVICE TIME: " «« setw(4) 
«« MAX SERVICE TIME «« endl; 
cout «« endl; 
cout «« "Customers served: " «« setw(4) «« nServed «« endl; 


cout << "Average waiting time: " << setw(7) 
«« double(totalWait) / nServed «« " seconds" «« endl; 
cout << "Average queue length: " << setw(7) 
<< double(totalLength) / SIMULATION TIME << " people" << endl; 





图 5-5 (48) 


等 待 队列 很 自然 地 能 被 表示 为 一 个 队列 。 顾 客 到 达 队 列 的 时 间 值 被 存储 在 队列 中 ， 它 能 
用 来 确定 顾客 到 达 队 首 所 花费 的 时 间 。 

该 仿真 被 以 下 常量 所 控制 : 

e SIMULATION TIME: 指定 了 仿真 的 持续 时 间 。 

e ARRIVAL PROBABILITY : 确定 了 在 一 个 单位 时 间 内 一 个 新 的 顾客 到 达 队 列 的 概 
率 。 为 了 符合 标准 的 统计 学 规定 ， 这 个 概率 被 表示 为 一 个 在 0 到 1 之 间 的 实数 。 

* MIN SERVICE TIME, MAX SERVICE TIME : 这 两 个 常量 分 别 定义 了 顾客 被 服务 
时 间 的 范围 。 对 于 任何 一 个 顾客 来 说 ， 收 银 员 在 他 们 身上 所 花费 的 时 间 的 总 和 是 在 
这 个 范围 内 的 一 个 随机 整数 。 224 

当 一 个 仿真 结束 后 ， 程 序 会 报告 该 仿真 的 常量 值 以 及 下 面 的 结果 : 

© 被 服务 的 总 顾客 数 。 

e 顾客 在 队列 中 平均 等 待 时 间 。 

e 队列 的 平均 长 度 。 

例如 ， 下 面 的 运行 示例 展现 了 给 定常 量 值 的 仿真 运行 之 后 的 结果 : 


Simulation results ao the MUS constante: p 
2000 





仿真 的 行为 很 大 程度 上 取决 于 用 于 控制 其 行为 的 变量 的 值 。 例 如 ， 假 设 单位 时 间 内 顾客 
到 达 队 列 的 概率 从 0.05 增加 到 0.10, 那么 用 这 些 参数 运行 这 个 仿真 将 得 到 下 面 的 结果 : 







Customers served: 
Average waiting time: 68.95 seconds 
— queue Senones 6.49 sue xd 





正如 你 所 看 到 的 ， 顾 客 到 达 概 率 变 为 双 倍 后 ， 造 成 了 平均 等 待 时 间 从 低 于 九 秒 钟 增加 
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到 超过 一 分 钟 ， 显 然 这 种 增加 是 动态 递增 的 。 造 成 这 种 糟糕 的 性 能 的 原因 在 于 : 仿真 运行 过 
程 中 每 秒 钟 顾客 到 达 的 概率 意味 着 新 的 到 达 的 概率 也 就 是 他 们 服务 的 概率 。 当 到 达 的 概率 增 
加 时 ， 队 列 的 长 度 以 及 平均 的 等 待 时 间 开 始 快速 地 增加 。 这 种 仿真 能 够 用 不 同 参数 值 进行 试 
验 。 这 些 试 验 反 过 来 能 够 在 相对 应 的 真实 社会 系统 中 验证 潜在 的 资源 问题 。 


5.4 Map 类 


本 节 介 绍 另 外 一 种 名 为 map 的 集合 类 ， 它 和 字典 从 概念 上 很 相似 。 字 典 允 许 你 查阅 一 
个 单词 来 了 解 它 的 含义 。 一 个 map 是 这 个 概念 的 概括 ， 它 提供 了 一 个 被 称 为 键 (key) 的 标 
签 和 一 个 相关 联 的 被 称 为 值 (value) 的 值 之 间 的 联系 ， 这 可 能 是 一 个 更 大 更 为 复杂 的 结构 。 
在 字典 例子 中 ， 键 就 是 你 所 要 查找 的 单词 ， 值 就 是 这 个 词 的 具体 定义 。 

Map 在 编程 中 有 许多 应 用 。 例 如 ， 一 种 编程 语言 的 解释 器 要 能 够 给 变量 赋值 ， 然 后 以 该 
变量 的 名 字 作 为 引用 。 一 个 Map 可 以 很 简单 地 存储 变量 的 名 字 和 其 所 对 应 的 值 之 间 的 联系 。 
当 它 们 在 这 种 环境 下 使 用 时 ，Map 经 常 被 称 为 符号 表 (symbol table). 

除了 本 节 所 描述 的 Map 类 之 外 ，Stanford 类 库 中 也 提供 了 一 种 具有 几乎 相同 结构 和 行为 
的 名 为 HashMap 的 类 。HashMap 类 更 加 有 效 ， 但 它 在 某 些 应 用 中 不 太 便 利 。 现 在 ， 你 最 
好 将 注意 力 集中 在 Map 类 上 ， 直 到 你 大 体 上 理解 了 Map 类 是 如 何 工 作 的 。 在 第 15 章 和 第 
16 章 中 ,你 将 有 机 会 学 习 上 述 两 种 不 同 的 Map 类 的 实现 方法 。 


5.4.1 Map 类 的 结构 


和 本 章 前 面 所 介绍 的 集合 类 一 样 ，Map 是 由 一 个 键 类 型 以 及 值 类 型 参数 化 的 模板 类 实 
现 的 。 例 如 ， 如 果 你 想 要 仿真 一 个 每 个 单词 都 和 其 定义 相 联系 的 字典 ， 可 以 先 声 明 一 个 名 为 
dictionary 的 变量 ， 如 下 所 示 : 


Map<string,string> dictionary; 


类 似 地 ， 如 果 你 正在 实现 某 种 编程 语言 ， 你 可 以 使 用 Map 通过 将 变量 名 与 其 值 相关 联 的 方 
式 来 存储 一 个 浮 点 变量 的 值 ， 如 下 所 示 : 


Map<string,double> symbolTable; 


上 述 声 明 语句 创建 了 两 个 没有 任何 键 和 值 的 空 的 Map 对 象 。 对 上 述 任意 一 个 Map 对 
象 ， 你 随后 都 可 向 其 添加 键 - 值 对 。 在 字典 中 ， 你 可 以 从 一 个 数据 文件 中 读 取 内 容 。 对 于 符 
号 表 , 一 旦 出 现 了 一 个 赋值 语句 ， 你 将 会 向 符号 表 中 添加 一 个 新 的 变量 与 值 的 关联 对 。 

X 5-5 给 出 了 Map 类 最 常见 的 一 些 方法 。 在 这 些 方法 中 ， 实 现 Map 概念 的 基本 方法 是 
put 以 及 get, put 方法 在 键 和 值 之 间 创 建 了 一 个 联系 。 这 个 操作 和 C++ 中 将 一 个 值 赋 给 
一 个 变量 类 似 : 如果 一 个 键 已 存在 一 个 与 之 相对 应 的 值 ， 则 这 个 旧 的 值 将 会 被 一 个 新 的 值 所 
取代 。get 方法 检索 最 近 和 该 键 相关 联 的 值 ， 因 此 和 使 用 变量 名 检索 变量 值 相 一 致 。 在 Map 
对 象 中 ， 如 果 对 于 一 个 特定 的 键 没有 与 其 对 应 的 值 ， 则 用 这 个 键 调用 get 方法 会 返回 值 类 
型 的 默认 值 。 你 可 以 通过 调用 containsKey 方法 来 检查 一 个 键 是 否 出 现在 该 Map 对 象 中 ， 
返回 的 结果 是 true 还 是 false 取决 于 该 键 是 否 存在 于 Map 对 象 中 。 


表 5-5 map.h 接口 中 的 条 目 


构造 函数 








Map<key type, value type» () 创建 一 个 空 的 关联 键 和 值 的 Map WR 
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(5) 
方法 
size() 返回 Map 对 象 中 含有 的 键 和 值 进行 关联 值 对 个 数 
isEmpty () 如 果 Map 对 象 是 空 的 ， 返 回 true 
将 特定 的 键 和 值 进行 关联 。 如 果 key 在 先前 的 Map 对 象 中 没有 定义 ， 
put (key, value) 则 一 个 新 的 值 被 添加 进来 ; 如 果 Map 对 象 中 已 存在 该 键 ktey， 则 旧 值 将 被 
新 值 所 替代 
ef (key) 返回 在 Map 对 象 中 当前 与 键 key 相关 联 的 值 。 如 果 该 键 没有 定义 ， 则 
get 方法 返回 值 类 型 的 默认 什 
r— 从 Map 对 象 中 删除 键 key 及 其 所 对 应 的 值 。 如 果 该 键 不 存在 ， 调 用 不 
会 对 Map 对 象 作出 任何 改变 
contaicsiieg (kc) ODE ahaa aii 若 存在 ， 则 返回 true; 反之 ， 
clear() 删除 Map 对 象 中 所 有 的 键 - 值 对 
操作 符 







fll get 方法 功能 一 样 ， 该 操作 符 在 Map 对 象 中 选 出 与 键 key 相关 联 的 
值 。 如 果 Map 对 象 中 不 存在 该 键 ， 则 该 选择 操作 符 会 创建 一 个 新 的 键 - 
值 对 ， 且 设置 其 对 应 的 值 为 值 类 型 的 默认 值 。 使 用 方 括号 查找 和 改变 某 
一 特定 键 的 值 的 Map 对 象 通常 被 称 为 关联 数组 (associative array) 


map [key] 





一 些 简单 的 图 将 会 帮助 你 加 深 对 Map 类 操作 的 理解 。 假 设 你 已 经 声明 了 一 个 类 型 为 
Map<sting, double» 的 变量 symbolTable， 正 如 你 在 前 面 所 看 到 的 。 该 声明 创建 了 
一 个 空 的 Map 对 象 ， 表 示 包 含 一 个 空 的 无 键 - 值 对 的 集合 ， 如 下 图 所 示 : 


symbolTable 


一 旦 你 有 了 Map 对 象 ， 你 可 以 使 用 put 方法 来 创建 新 的 键 与 值 之 间 的 关联 。 例 如 ， 你 可 以 
调用 以 下 语句 : 
symbolTable.put("pi", 3.14159); 


概念 上 的 效果 将 会 在 键 "pi" 518 3.141 59 之 间 添 加 一 种 关联 ， 如 下 图 所 示 : 


symbolTable 


类 似 地 ， 调 用 以 下 语句 : 


symbolTable.put("e", 2.71828); 


将 会 在 键 "e" 与 值 2.718 28 之 间 添 加 一 个 新 的 关联 ， 如 下 图 所 示 : 


symbolTable 

pi = 3.14159 

e = 2.71828 
然后 你 可 以 使 用 get 来 检索 这 些 值 。 调 用 symbolTable.get ("e") 将 得 到 值 2.718 28, 
调用 symbolTable.get ("pi") 将 返回 3.141 59, 
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尽管 就 数学 常量 来 说 ， 这 很 难 讲 得 通 ， 但 是 你 可 以 通过 调用 put 方法 来 修改 Map X 
中 的 值 。 例 如 ， 你 可 以 通过 调用 以 下 语句 重 置 "pi" 所 对 应 的 值 (1897 年 印第安 纳 州 大 会 
之 前 试图 尝试 做 的 事情 ): 


symbolTable.put("pi", 3.0); 


将 导致 Map 对 象 变 成 下 面 的 这 种 状态 : 


symbolTable 


pi- 3.0 

e - 2.71828 
在 这 种 情况 下 ,调用 symbolTable.containsKey ("pi") 将 会 返回 true; 与 之 相对 应 ， 
调用 symbolTable.containsKey ("x") 将 返回 false。 


5.4.22 在 一 个 应 用 中 使 用 Map 类 


如 果 你 经 常 乘坐 飞机 的 话 ， 你 可 以 快速 地 发 现世 界 各 地 的 每 一 个 机 场 都 有 一 个 由 国 
际 飞机 运输 协会 ( International Air Transport Association, IATA) 颁布 的 三 字母 代码 。 例 
如 ， 纽 约 市 的 约翰 Fe 肯尼迪 机 场 的 代码 为 JFK。 然 而 ， 其 他 的 这 些 代 码 很 难 被 分 辨 。 大 
多 数 基于 网 络 的 交通 运输 系统 提供 了 一 些 查阅 这 些 代 码 的 方法 ， 来 作为 对 它们 顾客 的 一 种 
服务 。 

假设 你 被 要 求 编 写 一 个 简单 的 C++ 程序 ， 用 来 从 用 户 处 读 取 一 个 机 场 的 三 字母 代码 ， 
然后 再 向 用 户 返 回 这 个 机 场 的 位 置 。 你 需要 的 数据 在 一 个 名 为 Airportcodes .txt MX 
本 文件 中 ， 这 个 文件 包含 了 上 千 条 由 国际 飞机 运输 协会 已 经 颁布 的 飞机 场 的 代码 。 文 件 中 的 
每 一 行 是 由 一 个 三 字母 代码 、 一 个 等 号 以 及 一 个 与 之 对 应 的 机 场 位 置 所 组 成 的 。 如 果 这 个 文 
件 是 按照 2009 年 机 场 旅客 流量 的 降序 排列 ， 并 且 由 国际 机 场 委员 会 编辑 ， 那 么 这 个 文件 将 
会 如 图 5-6 所 示 的 一 样 。 


AirportCodes.txt 
ATL-Atlanta, GA, USA 
ORD=Chicago, IL, USA 
LHR-London, England, United Kingdom 
HND-Tokyo, Japan 

LAX-Los Angeles, CA, USA 
CDG=Paris, France 
DFW-Dallas/Ft Worth, TX, USA 
FRA-Frankfurt, Germany 
PEK-Beijing, China 
MAD-Madrid, Spain 
DEN-Denver, CO, USA » 
AMS-Amsterdam, Netherlands 
JFK-New York, NY, USA 
HKG-Hong Kong, Hong Kong 
LAS-Las Vegas, NV, USA 
IAH-Houston, TX, USA 
PHX-Phoenix, AZ, USA 
BKK-Bangkok, Thailand 
SIN-Singapore, Singapore 





MCO-Orlando, FL, USA 


图 5-6 包含 部 分 机 场 代码 与 位 置 的 数据 文件 
Map 类 的 存在 使 这 个 应 用 很 容易 实现 。 图 5-7 展示 了 这 个 完整 的 应 用 程序 。 





* This program looks up a three-letter airport code in a Map object. 


*; 


#include <iostream> 
#include <fstream> 
#include <string> 
#include "error.h" 
#include "map.h" 
#include "strlib.h" 
using namespace std; 


/* Function prototypes */ 


void readCodeFile(string filename, Map<string,string> & map); 


/* Main program */ 


int main() { 
Map<string,string> airportCodes; 
readCodeFile("AirportCodes.txt", airportCodes) ; 
while (true) { 
string line; 
cout << "Airport code: "; 
getline(cin, line); 
if (line == "") break; 
string code = toUpperCase (line); 
if (airportCodes.containsKey(code)) { 
cout «« code «« " is in " «« airportCodes.get(code) «« endl; 
) eise ( 
cout «« "There is no such airport code" «« endl; 
) 
) 
return 0; 


) 


void readCodeFile(string filename, Map<string,string> & map) ( 
ifstream infile; 
infile.open(filename.c str()); 
if (infile.fail()) error("Can't read the data file"); 
string line; 
while (getline(infile, line)) ( 
if (line.length() < 4 || line[3] != '-') ( 
error("Illegal data line: " + line); 
} 
string code = toUpperCase(line.substr(0, 3)); 
map .Put (code, line.substr(4)); 
} 


infile.close(); 


图 5-7 查找 三 字母 机 场 代码 的 程序 


AirportCodes 应 用 中 的 主 程序 读 取 三 字母 代码 ， 查 找 其 相对 应 的 机 场 位 置 ， 


位 置 在 控制 台中 输出 ， 正 如 下 述 示例 程序 的 运行 结果 : 





sle 
| Airport code: LHR 
| LHR is in London, England, United Kingdom 
Airport code: SFO 
SFO is in San Francisco, CA, USA 
| Airport code: XXX 
| There is no such airport code 


| 
| 










Airport code: 






5.4.3 Map 类 作为 关联 数组 
Map 类 重 载 了 用 于 数组 查找 的 方 括号 操作 符 ， 因 此 代码 
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map[key] = value; 
扮演 了 代码 

map.put(key, value); 
的 简写 形式 。 


类 似 地 ， 与 map .get(key) 所 做 的 一 样 ， 表 达 式 map [key] KET Map 对 象 中 与 
key 相对 应 的 值 。 毫 无 疑问 ， 使 用 put 以 及 get 方法 的 简写 方式 非常 方便 ,但 是 鉴于 数组 和 
Map 类 是 两 种 完全 不 同 的 结构 ， 在 Map 类 中 使 用 数组 表示 法 可 能 令 人 惊讶 。 然而 ， 如 果 你 
从 更 抽象 的 角度 考虑 Map 类 和 数组 ， 则 和 你 刚 开 始 的 怀疑 相 比 ， 你 会 发 现 它们 是 很 相似 的 。 

要 统一 这 两 种 表面 上 看 起 来 不 一 样 的 结构 ， 你 可 以 把 数组 看 成 是 一 种 将 位 置 索引 和 元 素 
值 进 行 映 射 的 结构 。 例 如 ， 假 设 你 有 一 个 数组 ， 或 者 一 个 等 价 的 vector 对 象 ， 其 中 包含 
了 一 系列 由 你 记录 的 体育 比赛 的 分 数 : 


scores 
EDSTSTSTIS] 
0 1 2 3 4 


这 个 数组 将 键 0 映射 为 值 9.2， 将 键 1 映射 为 值 9.9， 将 键 2 映射 为 值 9.7 等 等 。 因 此 ， 你 可 
以 将 一 个 数组 看 成 是 一 个 用 整数 作为 键 的 Map 对 象 。 相 反 地 ， 你 也 可 以 把 一 个 Map X SUB 
成 是 一 个 使 用 键 作为 索引 的 数组 ， 这 也 正 是 Map 类 重 载 选择 语法 所 提倡 的 。 

使 用 数组 语法 来 完成 Map 类 的 操作 在 编程 语言 中 正 逐 步 流行 ， 它 甚至 已 超出 了 C++ 的 
领域 。 许 多 流行 的 脚本 语言 都 用 Map 类 来 实现 数组 ， 这 可 使 数组 使 用 索引 值 不 一 定 为 整数 。 
用 Map 类 作为 其 底层 实现 者 的 数组 被 称 为 关联 数组 (associative array) o 


5.5 Set 类 


集合 类 中 最 有 用 的 一 个 就 是 Set 类 ， 表 5-6 展示 了 其 相关 的 条 目 。 该 类 通常 用 于 建 模 
RA (set) 的 数学 抽象 ， 即 它 是 一 个 集合 ， 其 中 的 元 素 是 无 序 的 且 每 个 元 素 的 值 仅 出 现 一 
次 。Set 类 在 某 些 算法 应 用 中 极为 有 用 ， 因 此 值得 花费 单独 的 一 节 来 介绍 它 。 在 你 阅读 17 
章 中 更 为 详细 的 sec 类 的 论述 之 前 ， 举 几 个 关于 set 类 的 例子 是 非常 值得 的 ， 这 能 让 你 对 
Set 类 是 如 何 工作 以 及 它 在 应 用 中 为 何 非常 有 用 有 一 个 更 好 的 理解 。 


表 5-6 set.h 接口 中 的 条 目 


构造 函数 
方法 
size() 返回 Sec 对 象 中 元 素 的 个 数 
isEmpty () 如 果 Set 对 象 为 空 则 返回 true 
add (value) 向 Set 对 象 中 添加 值 value。 如 果 set 对 象 中 已 经 存在 该 值 ， 不 产生 任 


何 错误 ， 并 且 Set 对 象 保持 不 变 


从 Set 对 象 中 删除 该 值 value。 如 果 该 值 不 存在 ,不 产生 任何 错误 ,并 且 
Set 对 象 保 持 不 变 


contains (value) 如 果 sec 对 象 中 存在 该 值 value， 则 返回 true 


remove (value) 
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(5) 










clear () 


删除 Sec 对 象 中 的 所 有 元 素 
如 果 set 对 象 是 通过 参数 传递 的 Set 对 象 的 子 集 ， 则 返回 true 
返回 Set 对 象 中 由 值 类 型 确定 顺序 后 的 第 一 个 元 素 


isSubsetOf (set) 





操作 符 

ies 返回 si Als, 的 并 运算 (union) 结果 。 其 中 包含 的 元 素 是 两 个 原始 集合 中 
ee 的 所 有 元 素 
fl wih 返回 s Als. 的 交 运 算 (intersection) 结果 。 其 中 包含 的 元 素 是 两 个 原始 
di 集合 中 共同 的 元 素 
135. 3& [8] s; Als, 的 差 运 算 (difference) 结果 。 其 中 包含 的 元 素 是 只 出 现在 s 
! E: 而 未 出 现在 s; 中 的 元 素 

E = : z 就 像 数 值 运算 中 的 +、-、* 一 样 ， 这 些 操作 符 可 以 和 赋值 联系 在 一 起 。 对 
Si 十 = $; sS; -= $82 s, *= S 


于 += Al -=, s 的 值 可 以 是 一 个 集合 、 单 个 值 ， 或 者 是 用 逗号 隔 开 的 一 系列 值 


5.5.1 实现 <cctyPe> HE 


在 第 3 章 ， 你 已 经 学 习 了 <cctype> 库 ， 它 导出 了 一 些 测试 一 个 字符 类 型 的 判定 函数 。 
例如 ， 调 用 isdigit (ch) 将 测试 字符 ch 是 否 为 一 个 数字 字符 。 你 可 以 通过 测试 ch 是 否 
超过 了 单个 数字 字符 的 值 范围 来 实现 函数 isdigit， 如 下 所 示 : 

bool isdigit(ch) ( 


return ch >= '0' && ch <= '9'; 
} 


对 于 其 他 一 些 函 数 ， 情 况 可 能 变 得 更 为 复杂 一 些 。 用 同样 的 方式 实现 ispunct 函数 可 能 会 
有 点 困难 ， 因 为 标点 符号 分 布 在 ASCII 范围 的 好 几 个 间隔 中 。 如 果 你 将 所 有 的 标点 符号 定 
义 在 一 个 集合 中 ， 事 情 就 会 变 得 很 简单 ， 在 这 种 情况 下 ， 实 现 ispunct (ch) 你 所 要 做 的 
就 是 检查 字符 ch 是 否 出 现在 这 个 集合 中 。 

图 5-8 展示 了 用 集合 实现 <cctype> 中 的 判定 函数 。 这 段 代码 首先 对 于 每 一 种 字符 类 
型 都 创建 了 一 个 Set<char>， 然后 定义 了 判定 函数 ， 这 样 它 们 仅仅 在 适当 的 Set 对 象 中 调 
JH contains 就 可 以 实现 判定 函数 。 例 如 ， 为 了 实现 isdigit，cctype 的 实现 定义 了 一 
个 包含 所 有 数字 字符 的 Set 对 象 ， 如 下 所 示 : 


const Set<char> DIGIT SET = setFromString ("0123456789") ; 


出 现在 图 5-8 中 的 setFromString 函数 仅仅 是 一 个 辅助 函数 ， 它 通过 向 Set MR 
中 依次 添加 参数 字符 串 中 的 字符 来 创造 一 个 Set 对象。 这 个 函数 让 定义 Sec 对 象 变 得 很 简 
单 ， 例 如 ， 对 于 定义 标点 符号 字符 的 set 对 象 ， 你 只 需要 列 出 适合 其 描述 的 字符 即 可 。 

对 于 那些 抽象 和 高 级 的 操作 来 说 ,使 用 Sec 类 的 好 处 之 一 就 是 让 这 些 操作 更 易于 思考 。 
尽管 在 cctype .cpp 中 大 多 使 用 setFromString 从 实际 字符 中 来 创建 Set MR, (Az 
还 有 一 些 是 使 用 + 操作 符 ，+ 操作 符 在 set 类 中 被 重 载 了 ， 该 操作 可 以 返回 两 个 Sec 对象 
的 并 运算 结果 。 例 如 ， 一 旦 你 定义 了 set 对 象 LOWER_SET 和 UPPER_SET， 使 得 它们 可 以 
包含 小 写字 母 和 大 写字 母 ， 你 就 可 以 通过 编写 如 下 代码 来 定义 ALPHA SET: 


const Set<char> ALPHA SET = LOWER SET + UPPER SET; 
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/* 
* File: cctype.cpp 


* This program simulates the «cctype» interface using sets of characters 


xy 


#include <string> 
#include "cctype.h" 
#include "set .h" 
using namespace std; 


/* Function prototypes */ 
Set«char» setFromString(string str); 


/* 


* Constant sets 


* These sets are initialized to contain the characters in the 
* corresponding character class 


i 


const Set<char> DIGIT_SET setFromString ("0123456789") ; 

const Set<char> LOWER_SET setFromString ("abcdefghi jklmnopqrstuvwxyz") ; 

const Set<char> UPPER_SET setFromString ("ABCDEFGHIJKLMNOPORSTUVWXYZ") ; 

const Set<char> PUNCT SET = setFromString("!\"#$%s' ()*+,--/:;<=>?@[\\]*_"(1}"); 
const Set<char> SPACE_SET setFromString(" \t\v\f\n\r") ; 

const Set«char» XDIGIT SET - setFromString("0123456789ABCDEFabcdef"); 

const Set«char» ALPHA SET = LOWER SET + UPPER SET; 

const Set«char» ALNUM SET = ALPHA SET + DIGIT SET; 

const Set«char» PRINT SET = ALNUM SET + PUNCT SET + SPACE SET; 


/* Exported functions */ 


bool isalnum(char ch) ( return ALNUM SET.contains(ch); ] 
bool isalpha(char ch) { return ALPHA SET.contains(ch); } 
bool isdigit(char ch) ( return DIGIT SET.contains(ch); } 
bool islower(char ch) ( return LOWER SET.contains(ch); ) 
bool isprint(char ch) ( return PRINT SET.contains(ch); ) 
bool ispunct(char ch) ( return PUNCT SET.contains(ch); ) 
bool isspace(char ch) ( return SPACE SET.contains(ch); ) 
bool isupper(char ch) ( return UPPER SET.contains(ch); ) 

+ 


bool isxdigit (char ch) { return XDIGIT_SET.contains (ch) 


) 
/* Helper function to create a set from a string of characters */ 


Set«char» setFromString(string str) t 
Set<char> set; 
for (int i = 0; i < str.length(); i++) { 
set.add(str[i]); 
) 


return set; 





Al5-8 ”基于 集合 的 <cctype> 的 实现 


5.5.2 创建 单词 列表 


在 本 章 前 面 对 Map 类 的 讨论 中 ， 用 于 解释 底层 概念 的 示例 之 一 就 是 : 一 个 字典 中 的 键 
都 是 一 个 个 独立 的 单词 ， 并 且 其 对 应 的 值 就 是 该 单词 的 定义 。 在 某 些 应 用 中 ， 例 如 一 个 拼 
写 检查 程序 或 者 Scrabble 程序 (一 种 拼 字 游戏 )， 你 不 需要 知道 一 个 词 的 定义 ， 你 所 要 知道 
的 就 是 一 个 字母 的 组 合 是 否 是 一 个 合法 的 单词 。 在 那样 的 应 用 中 ，Sset 类 是 一 个 理想 的 工具 。 
与 一 个 Map 对 象 既 包 含 单词 又 包含 定义 不 一 样 ， 使 用 Set 类 你 所 需要 的 就 是 包含 所 有 合法 单 
词 的 Set<string>。 如 果 单 词 包含 在 set 对 象 中 ,那么 它 就 是 合法 的 ， 反 之 ， 则 是 非法 的 。 

一 个 只 有 单词 没有 与 之 对 应 的 解释 的 集合 我 们 称 之 为 字典 ( lexicon)。 如 果 你 有 一 个 包 
含 了 所 有 英文 单词 的 名 为 EnglishWords .txt 的 文本 文件 ， 并 且 每 个 单词 只 占 一 行 ， 你 
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可 以 通过 下 面 的 这 段 代 码 创建 一 个 英文 字典 : 


Set<string> lexicon; 
ifstream infile; 
infile.open("EnglishWords.txt"); 
if (infile.fail()) error("Can't open EnglishWords.txt"); 
string word; 
while (getline(infile, word)) ( 
lexicon.add (word); 
) 
infile.close(); 


5.5.3 Stanford 类 库 中 的 Lexicon 类 


尽管 对 于 一 个 字典 来 说 ， 用 Set 类 作为 其 底层 表示 表现 得 相当 好 ， 但 它 并 不 是 很 有 效 
率 。 因 为 一 个 高 效 的 字典 表示 法 可 能 会 给 编程 项 目 带 来 许多 令 人 激动 的 事情 。Stanford 类 库 
中 包含 了 一 个 名 为 Lexicon WA, BRE set 类 中 一 个 用 于 存储 单词 集合 的 优化 的 定制 版 
本 。 表 5-7 展示 了 由 Lexicon 类 导出 的 条 目 。 正 如 你 所 看 到 的 一 样 ， 它 们 和 Set 类 中 的 大 
多 数 条 目 是 一 样 的 。 

这 个 库 中 同时 还 包含 了 一 个 名 为 EnglishWords .dat 的 数据 文件 ， 这 是 一 个 已 编译 的 
包含 了 所 有 英文 单词 的 字典 。 使 用 英文 字典 的 程序 通常 都 使 用 以 下 声明 语句 对 其 进行 初始 化 : 


Lexicon english("EnglishWords.dat"); 


TEAR Scrabble 一 样 的 文字 游戏 中 ， 尽 可 能 多 地 记 住 两 个 字母 的 单词 是 很 有 用 的 ， 因 为 知道 两 

个 字母 的 单词 能 让 你 更 容易 地 知道 字典 中 以 这 两 个 字母 为 基础 的 新 单词 。 假 设 你 有 一 个 包含 

英文 单词 的 字典 ， 你 可 通过 生成 所 有 的 两 个 字母 的 字符 串 来 创建 这 样 一 个 列表 ， 然 后 再 用 这 

个 字典 检查 上 述 两 个 字母 的 字符 串 的 组 合 是 否 为 一 个 单词 。 上 述 代码 的 实现 如 图 5-9 所 示 。 
表 5-7 lexicon.h 接口 导出 的 条 目 

构造 函数 

Lexicon() 


创建 一 个 空 的 Lexicon 对 象 
通过 从 文件 file 中 读 取 数据 来 初始 化 一 个 Lexicon 对 象 


Lexicon (/ile) 





方法 
size() 返回 Lexicon 对 象 中 单词 的 总 数 
isEmpty () 如 果 Lexicon 对 象 为 空 ， 返 回 true 
ay 如 果 该 单词 在 Lexicon 对 象 中 不 存在 的 话 ， 则 向 其 中 添加 一 个 新 的 单词 


word。 所 有 的 单词 都 以 小 写字 母 形式 存储 在 Lexicon 对 象 中 


将 参数 名 为 file 文件 中 的 所 有 单词 添加 到 lexicon 对 象 中 。file 要 么 是 一 
addWordsFromFile (file) 个 其 单词 为 分 行 存储 的 文本 文件 ， 要 么 是 为 lexicon 对 象 而 特别 设计 其 格式 
的 己 编译 的 数据 文件 向 Lexicon 对 象 中 添加 file 中 所 有 的 单词 


contains (word) 如 果 单 词 word 存在 于 Lexicon 对 象 中 ， 则 返回 true 
containsPrefix (prefix) 如 果 Lexicon 对 象 中 的 任何 一 个 单词 都 是 以 特定 的 前 级 prefix 开头 ， 则 返回 true 
clear() 删除 Lexicon 对 象 中 的 所 有 的 单词 


在 下 一 节 ， 你 会 发 现 : 可 以 通过 浏览 字典 ， 然 后 输出 长 度 为 2 的 单词 的 方法 来 解决 这 个 
问题 。 然 而 ， 鉴 于 在 字典 中 有 超过 100 000 个 英文 单词 ， 而 只 有 676 (26X26) 个 单词 是 由 
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地 


两 个 字母 组 合 而 成 ， 因 此 采用 图 5-9 程序 代码 中 所 使 用 的 策略 将 更 加 高 效 。 
5.6 在 集合 上 进行 迭代 

图 5-9 中 介绍 的 TwoLetterWwords 程序 通过 生成 两 个 字母 的 所 有 可 能 组 合 ， 然 后 再 查 
阅 字 典 ， 检 查 这 些 两 个 字母 的 组 合 是 否 出 现在 英文 字典 中 的 方式 ， 产 生 了 一 个 由 两 个 字母 
组 成 的 单词 的 清单 。 另 一 种 达到 同样 效果 的 策略 是 浏览 字典 中 的 每 一 个 单词 ， 然 后 再 将 长 


度 为 2 的 单词 显示 出 来 。 要 做 到 这 一 点 ， 你 所 要 做 的 就 是 以 某 种 方式 每 次 一 个 单词 地 遍历 
Lexicon 对 象 中 的 每 个 单词 。 


/* 
* File: TwoLetterWords.cpp 


* 
* This program generates a list of the two-letter English words. 
* 


#ainclude <iostream> 
Kinclude "lexicon.h" 
using namespace std; 


int main() ( 
Lexicon english("EnglishWords.dat"); 
string word - "xx"; 
for (char c0 = 'a'; c0 <= 'z'; cO++) ( 
word[0] = c0; 
for (char cl = 'a'; cl <= 'z'; cl++) ( 
word[1] = c1; 
if (english.contains(word)) { 
cout << word << endl; 





图 5-9 生成 所 有 由 两 个 字母 构成 的 单词 的 程序 


对 于 任何 集合 类 而 言 ， 迭 代 其 中 的 元 素 是 一 个 基本 的 操作 。 此 外 ， 如 果 集 合 类 包 设计 得 
很 好 ， 用 户 应 该 能 够 使 用 同样 的 策略 来 实现 这 些 操 作 ， 无 论 是 一 个 Vector 对 象 还 是 Grid 
对 象 来 循环 地 遍历 其 中 的 每 个 元 素 , 或 者 是 遍历 一 个 Map 对 象 中 的 所 有 键 , 或 者 是 遍历 一 
个 Lexicon 对 象 中 的 所 有 单词 。 标 准 模板 库 提 供 了 一 个 强 有 力 的 名 为 迭代 器 (iterator) 的 
机 制 来 做 上 述 事 情 。 和 遗憾 的 是 ， 理 解 标准 迭代 器 需 要 熟悉 C++ 某 些 特定 的 底层 细节 ， 尤 其 
是 指针 的 概念 。 鉴 于 本 节 的 一 个 主要 目标 就 是 推迟 掩盖 这 些 细节 ， 直 到 你 了 解 了 高 层 的 思 
想 ， 对 于 实现 一 个 实际 上 很 简单 的 例子 ， 引 入 标准 迭代 器 会 牵扯 许多 复杂 的 事物 。 你 所 要 做 
的 就 是 表达 下 面 伪 代 码 所 建议 的 算法 思想 : 


For each element in a particular collection ( 
Process that element 


) 

大 多 数 现代 编程 语言 为 了 准确 地 表达 算法 思想 而 定义 了 一 种 对 应 的 语法 形式 。 但 遗憾 的 
Æ, 尽管 它 已 被 提议 将 在 未 来 的 某 个 版 本 中 发 布 ,但 C++ 语法 中 至 今 仍 不 包含 这 样 的 机 制 。 
然而 ， 好 消息 是 可 以 使 用 C++ 预 处 理 的 宏 定义 功能 来 准确 地 实现 你 想 要 出 现在 程序 中 的 东 
西 。 尽 管 这 个 实现 超过 了 本 章 集合 类 的 范围 ， 但 是 这 些 集合 类 一 一 包括 标准 模板 库 里 的 集合 
类 和 本 章 的 简化 版 本 一 一 支持 一 种 新 的 被 称 为 基于 范围 的 循环 (range-based for loop) 的 控 
制 模式 ， 如 下 所 示 : 
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for (type variable : collection) ( 
body of the loop 
} 


例如 ， 如 果 你 想 要 和 迭代 英语 字典 中 所 有 的 单词 ， 并 且 挑 选 出 只 含有 两 个 字母 的 单词 ， 你 可 以 
这 样 编写 代码 ， 如 下 所 示 : 
for (string word : english) { 
if (word.length() == 2) { 
cout << word << endl; 


) 
) 


基于 范围 的 循环 是 C++11 的 新 特性 ，C++11 是 2011 年 发 布 的 C++ 的 新 版 本 。 因 为 这 
个 版 本 是 最 近 发 布 的 ， 因 此 ，C++11 所 扩展 的 特性 还 没有 被 完全 的 合并 到 所 有 C++ 编程 环 
境 中 ， 包 括 了 几 个 主要 的 特性 。 如 果 你 使 用 的 是 一 个 旧 的 编译 器 ， 你 将 不 能 够 使 用 基于 范围 
的 循环 的 标准 形式 。 但 是 也 不 必 绝 望 ， 标 准 C++ 库 中 包含 了 一 个 名 为 foreach .h 的 接口 ， 
它 使 用 了 C++ 预 处 理 ， 用 一 个 很 熟悉 的 方式 定义 了 一 个 名 为 foreach M: 


foreach (type variable in collection) ( 
body of the loop 
) 


foreach 宏 与 基于 范围 的 循环 的 唯一 不 同 在 于 关键 字 的 名 字 ，foreach 中 使 用 关键 词 in 
而 不 是 一 个 冒号 。 和 基于 范围 的 循环 一 样 ，foreach 对 于 Stanford 类 库 和 标准 模板 库 中 实 
现 的 集合 类 都 起 作用 。 


5.6.1 iS CIF 


当 你 使 用 基于 范围 的 循环 时 ， 有 时 候 理 解 迭代 处 理 元 素 的 顺序 是 很 有 用 的 。 这 没有 什么 
通用 的 规则 。 对 于 迭代 顺序 ， 基 于 效率 上 的 考虑 ， 每 个 集合 类 都 定义 了 关于 其 自身 的 迭代 顺 
序 策略 。 你 之 前 见 过 的 类 ， 对 关于 元 素 值 的 顺序 都 进行 了 下 面 的 保证 : 

e 当 你 对 一 个 Vector 类 中 的 元 素 进行 遍历 时 ， 基 于 范围 的 循环 以 索引 位 置 为 序 来 对 

元 素 进行 遍历 ， 因 此 ， 索 引 位 置 为 0 的 元 素 首先 被 遍历 ， 紧 接着 是 索引 位 置 为 1 的 
元 素 ， 直 到 这 个 vector 类 中 的 最 后 一 个 元 素 被 遍历 。 因 此 ， 和 迭代 的 顺序 与 传统 的 
for 循环 模式 顺序 是 一 样 的 : 


for (int i = 0; i < vec.size(); i++) { 
code to process vec [i] 


) 


当 你 迭代 一 个 Grid 类 中 的 元 素 时 ， 基 于 范围 的 循环 首先 依次 浏览 行 数 为 0 的 各 元 
素 ， 然 后 再 浏览 行 数 为 1 的 各 元 素 ， 依 此 类 推 。Grid 类 的 迭代 策略 和 下 面 使 用 的 
for 循环 相 类 似 : 


for (int row = 0; row < grid.numRows(); row++) { 
for (int col = 0; col < grid.numCols(); col++) { 
code to process grid [row] [col] 
) 
} 


这 种 外 循环 出 现行 下 标 ， 它 的 遍历 顺序 被 称 为 行 优先 次 序 (row-major order). 
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e 当 你 对 Map 类 中 的 元 素 进行 遍历 时 ， 基 于 范围 的 循环 返回 以 键 为 序 的 且 由 其 类 型 决 
定 的 所 有 键 值 。 例 如 ， 一 个 键 类 型 为 整 型 的 Map 对 象 将 会 按照 数字 升序 的 顺序 排列 
其 键 值 。 一 个 键 类 型 为 字符 串 类 型 的 Map 对 象 将 会 按照 字典 序 ( lexicographic order) 
排列 其 键 值 ， 字 典 序 是 通过 比较 其 内 部 的 ASCII 码 值 来 决定 其 顺序 的 。 

e 当 你 对 一 个 Set 类 或 者 Lexicon 类 中 的 元 素 进行 遍历 时 ， 基 于 范围 的 循环 返回 的 

元 素 的 顺序 总 是 由 其 值 的 类 型 所 确定 的 。 在 Lexicon 类 中 ， 基 于 范围 的 循环 返回 小 

写字 母 的 所 有 单词 。 

你 不 能 使 用 基于 范围 的 循环 去 遍历 Stack 类 和 Queue 类 。 当 只 有 一 个 元 素 (这 个 

元 素 是 栈 顶 元 素 或 者 是 队 首 元 素 ) 是 可 见 的 时 候 ， 人 允许 自由 地 访问 这 些 结构 将 会 违 

背 栈 和 队列 的 读 取 原 则 。 


5.6.2 ”再 论 儿童 黑 话 


像 3.2 节 所 描述 的 一 样 ， 当 你 将 英语 转化 成 儿童 黑 话 时 ， 大 多 数 单词 将 转变 成 某 种 与 传 
统 的 英语 截然 不 同 的 ， 听 起 来 模糊 的 类 拉丁 文 语 言 。 然 而 ， 有 几 个 单词 在 它们 转化 后 恰好 与 
英文 单词 相同 。 例 如 ，trash 的 儿童 黑 话 是 ashtray，entry 的 儿童 黑 话 是 entryway。 但 这 些 单 
词 并 不 是 一 种 普遍 情况 ， 存 储 在 EnglishWords .dat 文件 中 的 字典 ， 有 超过 100 000 个 英 
语 单词 , 但 仅 有 27 个 单词 符合 上 述 情况 。 采 用 基于 范围 的 循环 和 第 3 章 中 PigLatin 程序 
Bj translateWord 函数 ， 可 以 容易 地 编写 出 图 5-10 中 列 出 所 有 这 些 单 词 的 程序 。 


/* 


* This program finds all English words that remain words when 

* you convert them to Pig Latin, such as "trash" (which becomes 
* "ashtray") and "entry" (which becomes "entryway"). The code 

* ignores words containing no vowels (mostly Welsh-derived 

* words like "cwm"), which don't change form under the Pig Latin 
* rules introduced in Chapter 3. 


*J/ 


#include <iostream> 
#include <string> 
#include <cctype> 
#include "lexicon.h" 
using namespace std; 


/* Function prototypes */ 


string wordToPigLatin(string word) ; 
int findFirstVowel (string word) ; 
bool isVowel (char ch); 


/* Main program */ 


int main() { 
cout << "This program finds words that remain words" 
<< " when translated to Pig Latin." << endl; 
Lexicon english ("EnglishWords.dat") ; 
for (string word : english) { 
string pig = wordToPigLatin (word) ; 
if (pig != word && english.contains(pig)) { 
cout << word << " -» " << pig << endl; 


} 


return 0; 





* The code for the helper functions appears in Figure 3-2 */ 


图 5-10 列 出 所 有 的 英文 单词 与 Pig Latin 单词 一 致 的 单词 程序 
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56.3 ”计算 单词 的 频率 


图 5-11 中 的 WordFrequency 程序 是 另 一 个 迭代 起 重要 作用 的 应 用 程序 。 采 用 之 前 示 
例 中 你 已 经 用 过 的 机 制 ， 则 必要 的 程序 代码 将 相当 简单 。 将 一 行 划分 成 一 个 个 单词 的 实现 策 
略 与 你 在 第 3 章 中 已 经 见 过 的 PigLatin 程序 很 类 似 。 为 了 记录 每 个 单词 以 及 它 出 现 的 频 
率 值 ， 你 明显 需要 一 个 Map<string，int> 对 象 。 


/* 
* File: WordFrequency.cpp 


* This program computes the frequency of words in a text file. 

*/ i 
#include <iostream> 
#include <fstream> 
#include <iomanip> 
#include <string> 
#include <cctype> 
#include "filelib.h" 
#include "map.h" 
#include "strlib.h" 
#include "vector.h" 
using namespace std; 


/* Function prototypes */ 


void countWords (istream & stream, Map<string,int> & wordCounts); 
void displayWordCounts (Map<string,int> & wordCounts); 
void extractWords (string line, Vector<string> & words); 


/* Main program */ 


int main() ( 
ifstream infile; 
Map<string,int> wordCounts; 
promptUserForFile(infile, "Input file: "); 
countWords (infile, wordCounts); 
infile.close(); 
displayWordCounts (wordCounts); 
return 0; 


Function: countWords 
Usage: countWords (stream, wordCounts) ; 


Counts words in the input stream, storing the results in wordCounts. 


x/ 


void countWords (istream & stream, Map<string,int> & wordCounts) ( 
Vector«string» lines, words; 
readEntireFile(stream, lines); 
for (string line : lines) ( 
extractWords (line, words); 
for (string word : words) ( 
wordCounts [toLowerCase (word) ] ++; 


Function: displayWordCounts 
Usage: displayWordCounts (wordCount) ; 


Displays the count associated with each word in the wordCount map. 


*/ 


void displayWordCounts (Map<string,int> & wordCounts) ( 
for (string word : wordCounts) ( 
cout «« left «« setw(15) «« word 
<< right << setw(5) << wordCounts[word] << endl; 





图 5-11 计算 单词 频率 的 程序 
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* 
tA 
* 


) 
/* 


* Function: extractWords 


* Extracts words from the line into the string vector words. 
ej 


void extractWords (string line, Vector«string» & words) ( 
words.clear(); 
int start - -1; 
for (int i = 0; i « line.length(); i++) ( 
if (isalpha(line[i])) ( 
if (start -- -1) start - i; 
] else { 
if (start >= 0) { 
words.add(line.substr(start, i - start)); 
start - -1; 
) 
) 


) 
if (start »- 0) words.add(line.substr(start)); 
) 





图 5-11 (4) 


对 于 那些 使 用 现代 化 工具 的 应 用 来 说 ， 计 算 单 词 频率 变 得 很 有 用 起 初 是 令 人 惊讶 的 。 例 
如 ， 过 去 的 几 十 年 中 ， 在 解决 那些 有 争议 的 著作 的 问题 上 ,计算 机 分 析 已 经 变 得 非常 重要 。 
这 里 有 几 个 伊丽莎白 一 世 时 代 的 戏剧 ,虽然 它们 并 不 是 莎士比亚 传统 的 著作 集中 的 一 部 分 ， 
但 这 些 戏 剧 仍 被 认为 可 能 是 由 莎士比亚 书写 的 。 相 反 地 ， 有 一 些 被 归于 莎士比亚 著作 集 的 戏 
剧 听 起 来 并 不 像 他 的 其 他 作品 ， 这 些 作品 实际 上 可 能 是 由 其 他 人 写 的 。 为 了 解决 这 样 的 问 
题 ， 人 研究 莎士比亚 的 学 者 准备 计算 出 现在 这 些 戏 剧 中 的 特定 单词 的 频率 ， 然 后 看 这 些 频 率 与 
根据 莎士比亚 已 知 的 作品 中 分 析 得 到 的 单词 频率 是 否 匹 配 。 

例如 ,假设 你 有 一 个 包含 了 莎士比亚 的 一 段 文章 的 文本 文件 ， 例 如 以 下 所 示 的 《麦克 白 》 
中 著名 的 句子 : 


Macbeth.txt 
Tomorrow, and tomorrow, and tomorrow 
Creeps in this petty pace from day to day 


如 果 你 试图 确定 莎士比亚 作品 中 单词 的 相关 频率 ， 你 可 以 使 用 WordFrequency 程序 计算 数 
据 文件 中 每 个 单词 出 现 的 次 数 。 因 此 ， 给 定 文件 Macbeth .txt， 你 的 程序 可 能 如 下 所 示 : 





: Macbeth.txt 





2 
1 
2 
1 
1 
ice 1 
1 
1 
1 
3 
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本 章 小 结 


本 章 介 绍 了 C++ W Vector, Stack, Queue, Map 和 Set 类， 它们 一 起 代表 了 存储 
集合 的 一 个 强大 的 框架 。 目 前 ， 你 只 需要 从 用 户 的 角度 来 看 待 这 些 类 。 在 后 续 的 章节 中 ， 你 
将 有 机 会 更 深入 地 学 习 它 们 是 如 何 实现 的 。 鉴 于 当 你 完成 本 书 的 学 习 后 ， 可 能 会 实现 这 些 
集合 类 ， 虽 然 它们 也 提供 了 一 些 非常 类 似 的 方法 集合 ， 但 这 里 介绍 的 类 都 是 标准 模板 库 中 
vector, stack, queue, map 和 set 类 的 某 种 程度 上 的 简化 。 

本 章 重 点 包括 : 


根据 其 行为 而 不 是 其 表示 进行 定义 的 数据 结构 被 称 为 抽象 数据 类 型 ( abstract data 
type)。 与 基本 数据 类 型 相 比 ， 抽 象 数 据 类 型 有 一 些 重要 的 优点 。 这 些 优点 包括 简单 
性 、 灵 活性 和 安全 性 。 

包含 其 他 对 象 并 作为 一 个 完整 集合 的 元 素 类 被 称 为 集合 类 ( collection classe)。 在 
C++ 中 ， 集 合 类 的 定义 使 用 了 模板 (template)， 即 参数 化 类 型 ( parameterized type), 
其 中 元 素 的 类 型 名 出 现在 集合 类 名 字 之 后 的 尖 括 号 中 。 例 如 ， 类 Vector<int> 表 
示 一 个 包含 元 素 值 类 型 为 int 的 Vector 类 。 

矢量 Vector 类 是 一 种 抽象 数据 类 型 ， 它 的 行为 与 一 个 一 维 数组 很 像 ， 但 更 加 强大 。 
和 数组 不 一 样 的 是 ， 一 个 Vector 对 象 可 以 随 着 元 素 的 增加 和 减少 其 尺寸 可 动态 地 
变化 。Vector 类 也 更 加 安全 ， 因 为 它 检 查 确 保 所 有 的 索引 都 在 其 范围 中 。 尽 管 你 
可 以 使 用 Vector 对 象 中 包含 多 个 vector 对 象 来 创建 一 个 二 维 结构 ， 但 是 使 用 
Stanford 类 库 中 的 Grid 类 将 更 加 简单 。 

栈 Stack 类 表示 了 一 种 对 象 的 集合 ， 这 些 对 象 的 行为 表现 为 从 一 个 栈 中 删除 元 素 的 
方向 与 向 栈 中 添加 元 素 的 方向 相反 : MAH (LIFO), stack 类 的 基本 操作 是 
push， 也 就 是 向 栈 中 添加 一 个 元 素 ， 另 一 个 基本 操作 是 pop ， 即 删除 并 返回 最 近 添 
加 的 元 素 值 。 

队列 Queue 类 和 栈 Stack 类 相似 ,但 有 一 点 不 同 。 从 一 个 队列 中 删除 元 素 和 添加 
元 素 的 顺序 相同 : 即 先 进 先 出 (FIFO)。 一 个 队列 的 基本 操作 是 enqueue， 也 就 是 
在 队列 的 末尾 添加 一 个 元 素 ， 另 一 个 基本 操作 是 dequeue， 即 从 队列 的 开始 删除 一 
个 元 素 并 且 返 回 该 元 素 值 。 

Map 类 在 某 种 程度 上 实现 了 键 (key) 与 值 (value) 的 关联 ， 以 便 能 够 高 效 地 检索 这 
些 关 联 。 一 个 Map 对 象 的 基本 操作 是 put， 也 就 是 向 Map 对 象 中 添加 一 个 键 - 值 
对 ， 另 一 个 基本 操作 是 get ， 即 返回 一 个 特定 的 键 所 关联 的 值 。 

Set 类 表示 一 个 集合 ， 和 数学 中 的 集合 一 样 ， 这 个 集合 中 的 元 素 是 无 序 的 并 且 每 个 
元 素 只 能 出 现 一 次 。 一 个 Sec 对 象 的 基本 操作 包含 了 add, WREN Set 对 象 中 添 
加 一 个 新 的 元 素 ， 同 时 也 包含 了 contains ， 即 检查 一 个 元 素 是 否 已 存在 于 Set 对 
象 中 。 

除了 Stack 和 Queue 类 ， 所 有 的 集合 类 都 支持 foreach 模式 ， 它 使 循环 遍历 集 
合 中 的 元 素 变 得 很 简单 。 和 在 “和 迭代 顺序 ”这 一 节 中 所 描述 的 一 样 ， 每 一 个 集合 类 
都 定义 了 自己 的 元 素 迭 代 顺 序 。 

另外 ， 对 于 Map 类 和 set 类 ，Stanford 类 库 都 提供 了 非常 相关 联 的 HashMap 和 
HashSet 类 。Map 类 与 HashMap 类 的 唯一 不 同 (或 者 Set 5 HashSet 类 之 间 ) 
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在 于 其 基于 范围 的 循环 的 迭代 元 素 顺 序 不 同 。Map 和 Set 以 其 元 素 类 型 值 的 升序 来 
迭代 元 素 ， 而 HashMap 和 Hashset 类 更 高 效 ， 它 们 似乎 以 随机 顺序 来 迭代 元 素 。 


复习 题 

1. 判断 题 : 一 个 抽象 的 数据 类 型 是 以 其 行为 定义 而 不 是 根据 其 表示 来 定义 的 。 

2. 本 章 中 列举 的 将 一 个 类 的 行为 与 其 基本 实现 相 分离 的 三 个 好 处 是 什么 ? 

3. 什么 是 标准 模板 库 (STL) ? 

4. 如 果 你 想 在 一 个 程序 中 使 用 Vector 类 ， 你 需要 在 你 程序 的 开始 加 上 什么 样 的 #include ? 

5. 列 出 至 少 三 个 与 C++ 中 提供 的 基本 的 数组 机 制 相 比 ，Vector 类 更 具有 的 优势 。 

6. 边界 检查 这 个 术语 的 含义 是 什么 ? 

7. 什么 是 一 个 参数 化 类 型 ? 

8. 你 将 使 用 什么 样 的 类 型 名 来 存储 一 个 元 素 类 型 为 布尔 类 型 的 Vector ? 

9. 判断 题 : Vector 类 的 默认 构造 函数 创建 了 一 个 含有 10 个 元 素 的 Vector 对象， 不 过 你 可 以 在 之 后 

将 其 变 大 。 

10. 如 何 初始 化 一 个 含有 20 个 元 素 ， 并 且 其 元 素 值 都 等 于 0 的 Vector<int> MR? 

11. 你 可 以 调用 什么 样 的 方法 来 确定 一 个 Vector 对 象 中 的 元 素 个 数 ? 

12. 如 果 一 个 Vector 对 象 含有 NN 的 元 素 ，insert 方法 的 第 一 个 参数 的 合法 范围 是 什么 ? remove 
方法 的 参数 的 合法 范围 是 什么 ? 

13. 让 Vector 类 能 够 避免 明确 地 使 用 get 和 sec 方法 的 特点 是 什么 ? 

14. 为 什么 通过 传递 引用 的 方式 传递 Vector 对 象 和 其 他 集合 对 象 是 很 重要 的 ? 

15. 你 会 使 用 什么 样 的 声明 去 创建 一 个 名 为 chessboard， 并 且 元 素 类 型 都 为 字符 的 8 x 8Grid WR? 

16. 对 于 上 个 习题 中 给 出 的 chessboard 变量 ， 如 何 给 最 左边 以 及 最 右边 的 角落 赋值 字符 的 'R' (在 
国际 象棋 的 表示 法 中 ， 这 代表 了 白色 的 车 )。 

17. 首 字母 缩写 词 LIFO 和 FIFO 代表 了 什么 ? 这 些 术 语 是 怎么 运用 在 栈 和 队列 中 的 ? 

18. 对 于 一 个 栈 来 说 ， 两 个 基本 操作 的 名 称 是 什么 ? 

19. 队列 的 基本 操作 是 什么 ? 

20. 在 Stack 类 和 Queue 类 中 ，peek 操作 都 做 了 什么 ? 

21. 用 你 自己 的 语言 表述 在 仿真 程序 中 出 现 的 离散 时 间 的 意义 ? 

22. Map 类 中 使 用 的 两 种 类 型 参数 是 什么 ? 

23. 如 果 在 一 个 Map HAF, RH get 调用 一 个 不 存在 于 该 对 象 中 的 键 将 会 发 生 什么 ? 

24. 你 把 一 个 Map 对 象 看 成 是 一 个 关联 数组 ， 那 么 get 和 set 方法 的 语法 缩写 形式 是 什么 ? 

25. 为 什么 Stanford 类 库 中 包含 了 一 个 单独 的 Lexicon 类 ， 即 使 这 个 类 可 使 用 Set 类 来 简单 的 实现 ? 

26. 哪 两 种 类 型 的 数据 文件 支持 Lexicon 类 的 构造 函数 ? 

27. 基于 范围 的 循环 模式 的 一 般 形式 是 什么 ? 

28. 本 章 中 对 于 Stack 类 和 Queue 类 不 提供 基于 范围 的 循环 的 原因 是 什么 ? 

29. 对 于 本 章 介绍 的 每 一 种 集合 类 ， 描 述 用 基于 范围 的 循环 处 理 其 元 素 时 的 顺序 。 


习题 
1. 编写 以 下 重 载 函 数 ， 


void readVector(istream & is, Vector<int> & vec); 
void readVector(istream & is, Vector<double> & vec); 
void readVector(istream & is, Vector<string> & vec); 


这 些 函 数 都 是 从 指定 的 输入 流 is 向 Vector 对 象 vec 中 输入 数据 。 在 输入 流 中 ， 
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Vector 对 象 的 元 素 出 现在 其 自身 的 一 行 中 。 函 数 一 直 读 取 元 素 直到 遇 到 了 空 行 或 者 文件 的 结尾 。 
为 了 解释 这 个 函数 的 操作 ， 假 设 你 有 一 个 数据 文件 : 246 


SquareAndCubeRoots.txt 





Neree 


t: 
T; 
p 
ic 
PS 
i. 
Te 
2. 


并 且 你 已 经 对 这 个 文件 创建 了 一 个 名 为 infile 的 输入 流 。 此 外 ， 假 设 你 已 经 声明 了 一 个 名 roots 
的 变量 ， 如 下 所 示 : 


Vector<double> roots; 


第 一 次 调用 readVector (infile, roots) ff roots 初始 化 为 一 个 包含 数据 文件 前 四 个 
元 素 的 对 象 。 第 二 次 调用 将 roots 的 值 修改 为 在 数据 文件 末尾 出 现 的 八 个 元 素 。 第 三 次 调用 将 
roots 变 为 一 个 空 的 Vector 对 象 。 

2. 在 统计 学 里 ， 一 个 数据 值 的 集合 经 常 被 称 为 一 个 分 布 ( distribution)。 统 计 分 析 的 一 个 主要 目标 是 找 
到 一 些 方法 来 把 完整 的 数据 集合 压缩 成 为 一 个 简明 扼要 的 统计 资料 ， 进 而 从 整体 上 表达 其 分 布 特性 。 
最 常见 的 统计 方法 就 是 平均 值 (mean)， 也 就 是 传统 的 平均 。 对 于 分 布 xf Xe Xas e Xa PHE 
通常 用 符号 x 表示 。 试 编写 以 下 函数 : 
double mean (Vector<double> & data); 
返回 Vector 对 象 中 数据 的 平均 值 。 

3. 另 一 种 常见 的 统计 方法 就 是 标准 差 ( standard deviation)， 它 表明 了 分 布 x、x 、x、… 、xn， 中 的 值 
偏离 平均 数 的 多 少 。 在 数学 形式 中 ,标准 差 (o) 被 表达 成 如 下 形式 ， 对 照 此 例 ， 如 果 你 正在 计算 一 
个 完整 的 分 布 的 标准 差 : 


i=l 247 
n 


希腊 字母 X 表示 的 是 每 一 个 单独 的 数据 值 与 平均 值 差 的 平方 和 。 编 写 一 个 函数 : 
double stddev(Vector«double» & data); 


返回 数据 分 布 的 标准 差 。 
4. 直方 图 是 一 个 图 ， 它 通过 把 数据 划分 进 单独 的 范围 ， 然 后 指出 每 个 范围 内 中 有 多 少 个 数据 值 落 入 该 
范围 的 方式 来 显示 一 组 值 。 例 如 ， 给 出 一 组 考试 分 数 : 
100, 95, 47, 88, 86, 92, 75, 89, 81, 70, 55, 80 
一 个 传统 的 直方 图 有 如 下 形式 : 


* 
» 
» 
Sex n n n 
* 
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直方 图 中 的 星 号 表示 : 有 一 个 分 数 在 40 ~ 49 之 间 ， 有 一 个 分 数 在 50 — 59 之 间 ， 有 五 个 分 数 
在 80 ~ 89 之 间 ， 依 此 类 推 。 

然而 ， 当 你 用 计算 机 生成 直方 图 的 时 候 ， 将 其 放 在 一 页 的 一 边 是 很 简单 的 ， 如 以 下 这 个 示例 运 
行 结果 : 








编写 一 个 程序 ， 这 个 程序 从 一 个 数据 文件 中 向 一 个 元 素 类 型 为 整 型 的 Vector 对 象 中 输入 数据 ， 

然后 在 一 个 直方 图 中 显示 这 些 数字 ， 这 个 直方 图 被 划分 的 范围 依次 是 0 — 9. 10 — 19、20 — 29, 
[4s] ” 依 此 类 推 ， 直 到 只 包含 值 100 的 范围 。 你 的 程序 应 该 尽 可 能 产生 和 示例 程序 一 样 的 输出 。 
5. 通过 定义 一 个 名 为 hist.h 的 接口 来 扩展 之 前 习题 的 灵活 性 ， 这 个 接口 给 出 了 用 户 对 于 直方 图 的 形式 
的 更 多 的 控制 。 你 的 接口 的 最 低 要 求 是 : 应 该 允许 用 户 指 定 最 大 值 和 最 小 值 ， 以 及 每 个 直方 图 范围 
的 大 小 ， 但 你 也 可 以 额外 的 添加 一 些 其 他 的 功能 。 
6. 公元 前 3 世纪 ， 古 希腊 天 文学 家 埃 拉 托 色 尼 发 明了 一 种 用 于 发 现 不 超过 N 的 所 有 素数 的 算法 。 为 了 
应 用 这 种 算法 ， 你 首先 写 出 一 组 在 2 到 NN 之 间 的 整数 。 例 如 ， 如 果 N 是 20， 你 可 以 写 出 如 下 所 示 
的 一 组 数字 : 
234567891011 12 13 14 15 16 17 18 19 20 


然后 ， 你 给 列表 中 的 第 一 个 数字 划 上 一 个 圆圈 ， 表 明 你 已 经 找 出 了 一 个 素数 。 当 你 给 一 个 数 标 
记 为 素数 时 ， 你 检查 列表 中 剩余 的 数字 并 且 划 掉 这 个 素数 的 倍数 ， 因 为 这 些 倍 数 都 不 可 能 为 素数 。 
因此 ， 当 你 执行 完 这 个 算法 的 第 一 轮 时 ， 你 将 会 圈 出 数字 2， 并 且 划 掉 了 数字 2 的 倍数 ， 如 下 所 示 : 


Q) 3 X 5 X 7 X 9 Mi M13 € 159€ v 9€ 19 XA 
为 了 完成 这 个 算法 ， 你 只 需要 重复 一 个 过 程 ， 这 个 过 程 首 先 圈 出 第 一 个 既 没 有 被 圈 也 没有 被 划 
掉 的 数字 ， 然 后 再 划 掉 这 个 数字 的 倍数 。 在 这 个 例子 中 ， 你 将 会 圈 出 3 作为 一 个 素数 ， 然 后 在 剩余 
列表 中 划 掉 3 的 倍数 ， 这 将 会 导致 列表 变 成 下 面 的 状态 : 


OOX 5 X 7 KKM n XC 13 XO0€ € 0 X 19 X 
最 终 ， 列 表 中 既 没 有 被 图 也 没有 被 划 掉 的 数字 如 下 图 所 示 : 


QQG)X GX Ox X X0» 3000 (9X 
这 些 被 圈 出 的 数字 都 是 素数 ， 被 划 掉 的 数字 都 是 合 数 。 这 个 算法 被 称 为 埃 拉 托 色 尼 筛 法 (sieve 
of Eratosthenes) 
编写 一 个 程序 ， 使 用 爱 拉 托 色 尼 得 法 产生 一 个 2 到 1000 之 间 素 数 的 列表 。 
7. 与 使 用 Vectorz 类 不 同 ， 使 用 Grid 类 的 一 个 问题 就 是 很 难 创 建 一 个 带 有 特殊 初始 值 的 集合 ， 这 就 
需要 你 使 用 操作 符 += 来 添加 你 想 要 加 入 的 元 素 。 一 种 使 这 个 过 程 合 理化 的 方法 就 是 定义 一 个 函数 
来 初始 化 一 个 Grid 对 象 : 


void fillGrid(Grid«int» & grid, Vector<int> & values); 
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该 函数 从 vector 对 象 中 取 值 ， 然 后 向 Grid 对 象 中 添加 元 素 。 例 如 ， 以 下 代码 : 


Grid<int> matrix(3, 3); 
Vector<int> values; 
values += 1, 2, 3; 

values += 4, 5, 6; 

values += 7, 8, 9; 
fillGrid(matrix, values); 


初始 化 变量 matrix， 则 为 一 个 包含 如 下 图 所 示 值 的 3 x 3 的 Grid 对象: 





. 魔方 是 二 维 的 整 型 Grid 对 象 ， 并 且 这 个 对 象 的 行 、 列 以 及 对 角 线 的 元 素 加 起 来 都 等 于 相同 值 。 图 
5-12 展现 的 是 一 个 著名 的 魔方 ， 它 出 现在 1514 年 由 阿尔 布雷 特 ， 丢 勒 C Albrecht Dürer) 雕刻 的 
Melencolia I 上 ， 在 这 个 雕像 的 右上 角 时 钟 的 下 面 有 一 个 4x4 的 魔方 。 在 丢 勤 的 魔方 中 ， 可 以 很 容 
易 地 看 到 在 图 右边 放大 的 插图 中 ， 每 一 行 、 每 一 列 和 两 条 对 角 线 上 的 元 素 相 加 之 和 都 等 于 34。 一 
更 加 熟悉 的 例子 就 是 下 面 3X3 的 魔方 ， 其 中 每 一 行 、 每 一 列 和 对 角 线 上 的 元 素 相 加 之 和 都 等 于 15， 
如 下 图 所 示 : 





实现 一 个 函数 : 


bool isMagicSquare (Grid<int> & square); 
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请 测试 一 个 Grid 对 象 包含 的 是 否 是 一 个 魔方 。 你 的 程序 应 该 可 以 在 任何 大 小 的 Gria 对 象 中 运 

行 。 如 果 你 对 一 个 行 数 和 列 数 不 相 同 的 Grid 对 象 调 用 isMagicSquare， 函 数 应 该 只 返回 false, 

9. 在 过 去 的 几 年 里 ， 一 个 名 为 数 独 (Sudoku) 的 新 的 逻辑 问题 在 全 世界 广泛 地 流行 。 在 数 独 中 ， 开 始 

的 时 候 有 一 个 元 素 类 型 为 整 型 的 9X9 的 Grid 对 象 ， 并 且 其 中 的 一 些 单元 格 已 经 填 上 了 1 到 9 之 间 

的 整数 。 在 这 个 问题 中 ， 你 的 工作 是 在 空白 的 单元 格 中 填 上 1 到 9 之 间 的 整数 ， 使 得 每 个 整数 在 每 

一 行 、 每 一 列 和 每 一 个 小 的 3 x 3 的 正方 形 中 只 出 现 一 次 。 每 一 个 数 独 问 题 都 要 很 小 心 的 创建 以 便 它 
们 只 有 一 个 答案 。 例 如 ， 图 5-13 左边 展现 了 一 个 典型 的 数 独 问题 ， 右 边 是 这 个 问题 的 唯一 答案 。 
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图 5-13 典型 的 数 独 问题 和 它 的 解 


尽管 在 第 9 章 之 前 你 不 需要 发 现 解决 数 独 问题 的 算法 策略 ， 但 是 你 可 以 编写 一 个 方法 检查 一 个 被 
提议 的 答案 是 否 遵循 了 每 一 行 、 每 一 列 以 及 3 x 3 正方 形 中 不 能 有 重复 的 数 独 规则 。 编 写 一 个 函数 : 
bool checkSudokuSolution(Grid<int> & puzzle); 

执行 这 个 检查 ， 并 且 当 puzzle 是 有 效 的 答案 时 ， 返 回 true。 程 序 应 该 检查 以 确保 puzzle 
包含 了 一 个 元 素 类 型 为 整 型 的 9X9 的 Grid 对 象 ， 并 且 当 不 满足 这 个 情况 时 报告 错误 。 

10. 在 扫雷 游戏 中 ， 对 于 一 个 很 小 的 网 格 ， 一 个 玩家 在 一 个 矩形 的 网 格 中 寻找 隐藏 的 雷 可 能 像 下 面 这 样 : 
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在 C++ 中 ， 一 种 代表 这 种 网 格 的 方法 是 使 用 元 素 类 型 为 布尔 类 型 的 Gria WH. HFA Grid 对 
象 中 元 素 的 值 标示 了 雷 的 位 置 ， 即 元 素 值 为 true 表示 这 个 位 置 有 一 个 雷 。 采 用 布尔 形式 ， 这 个 例 
Cj Grid 对 象 应 该 如 下 图 所 示 : 
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给 出 一 个 表示 雷 位 置 的 Grid 对 象 ， 编 写 一 个 函数 : 
void fixCounts (Grid<bool> & mines, Grid<int> & counts); 


使 用 引用 参数 counts 来 返回 一 个 元 素 类 型 为 整 型 的 Grid 对 象 ， 在 这 个 对 象 中 ， 每 一 个 元 素 表明 
了 在 mines 这 个 Grid 对 象 中 的 每 个 位 置 相 应 附近 的 雷 的 数目 ， 一 个 位 置 的 附近 包括 了 它 自身 所 在 
的 位 置 以 及 任何 八 个 在 Grid 对 象 边 界 内 的 相 邻 位 置 。 例 如 ， 如 果 mineLocations， 包 含 了 这 一 
页 开始 时 所 展示 的 元 素 类 型 为 布尔 的 Grid 对 象 ， 以 下 代码 : 


Grid<int> mineCounts; 
fixCounts (mineLocations, mineCounts); 


将 mineCounts 初始 化 为 如 下 形式 : 





11. Grid 类 中 的 resize 方法 既 重 置 了 一 个 Grid 对 象 的 维 数 ， 同 时 也 将 该 Gira 对 象 的 每 一 个 元 素 
初始 化 为 默认 值 。 编 写 一 个 函数 : 


void reshape (Grid<int> & grid, int nRows, int nCols); 


调整 Grid 对 象 的 大 小 ， 但 填写 的 数据 须 通 过 拷贝 的 方式 按 标 准 的 行 主 序 (从 左 到 右 / 从 
上 到 下 ) 方式 进行 。 例 如 ， 如 果 myGrid 初始 时 包含 值 ， 如 下 图 所 示 : 





调用 函数 
reshape (myGrid, 4, 3) 


将 myGrid 的 维 数 及 内 容 修改 成 如 下 图 所 示 : 





如 果 新 的 Grid 对 象 没有 足够 的 空间 用 于 存储 原始 的 值 ， 原 Grid 对 象 底下 的 值 会 被 舍弃 掉 ， 例 
如 ， 如 果 你 调用 以 下 函数 ; 


reshape(myGrid, 2, 5) 


这 里 没有 足够 的 空间 来 容纳 最 后 两 个 元 素 ， 所 以 新 的 Grid 对 象 如 下 图 所 示 : 


12. 


13. 
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相反 地 ， 如 果 原 来 的 Grid 对 象 中 没有 足够 的 元 素来 填充 其 空间 ， 新 的 Grid 对 象 中 最 后 的 元 素 保 
持 它 们 的 默认 值 。 

编写 一 个 程序 ， 使 用 栈 从 控制 台中 逆序 读 取 一 个 整数 序列 ， 其 中 ， 控 制 台 的 每 一 行 只 包含 一 个 整 
数 ， 示 例 程序 的 运行 结果 如 下 图 所 示 : 
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现在 是 第 一 个 

将 变 成 最 后 一 个 

就 时 间 而 言 ， 它 们 是 一 个 变革 的 时 代 。 

Hz e EW, “AER (The Times They Are a-Changin)" , 1963 
从 鲍 勃 ， 迪 伦 的 歌曲 中 获得 灵感 ， 编 写 一 个 函数 ， 


void reverseQueue (Queue<string> & queue); 


颠倒 一 个 队列 中 的 元 素 。 记 住 你 没有 接触 过 队列 的 内 部 表示 方法 ， 因 此 ， 你 必须 想 出 一 个 算法 〈 假 
定 涉及 其 他 的 结构 ) 用 于 完成 这 个 任务 。 





. 编写 一 个 程序 ， 检 查 一 个 字符 串 中 的 括号 ( 圆 括号 、 方 括号 和 花 括 号 ) 是 否 匹 配 。 考 虑 以 下 字符 串 : 


{s =2 * (a[2] + 3); x = (1 + (2); } 


MRA FAITE, SRO ATES ARE ERE, BIA Zc PUT 5 I— 3 Dd 
号 相 匹 配 ， 每 一 个 左 方 括号 和 一 个 右 方 括号 相 匹 配 ， 依 此 类 推 。 另 一 方面 ， 下 面 的 字符 串 都 是 不 匹 
配 的 ， 并 且 已 经 给 出 原因 : 

ctt D 这 行 缺 少 了 一 个 右 括号 

) ( 右 括号 在 左 括号 之 前 出 现 

CO) FES PEA AMA 4 HE 


.本 书 中 的 图 表 都 是 使 用 由 Adobe 公司 在 20 世纪 80 年 代 早期 开发 的 强大 的 图 形 语言 PostScript@ 创 


EH PostScript 程序 将 其 数据 存在 一 个 栈 中 。PostScript 中 可 使 用 的 操作 符 在 某 种 程度 上 对 栈 的 操 
作 都 有 效果 。 例 如 ， 你 可 以 调用 pop 操作 符 ， 这 将 会 弹出 栈 顶 元 素 ， 或 者 调用 exch 操作 符 ， 这 
将 会 交换 栈 中 的 两 个 元 素 。 

PostScript 操作 符 中 一 个 最 有 趣 (并 且 是 最 有 用 ) 的 操作 符 是 roll 操作 符 ， 它 需要 两 个 参数 
n 和 k。 调 用 roll (n, k) 的 效果 是 将 一 个 栈 顶 的 mn 个 元 素 转动 k 个 位 置 ， 旋 转 的 方向 一 般 朝 着 
栈 项 。 更 加 特殊 地 是 ，rol1 (n, k) 的 效果 是 移动 栈 项 的 n 个 元 素 ， 将 上 面 的 元 素 循环 至 最 底下 
的 位 置 k 次 ,然后 在 栈 中 更 换 重新 排序 的 元 素 。 图 5-14 展示 了 三 个 调用 roll 函数 之 前 和 之 后 的 
不 同 例子 的 图 片 。 
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roll(4, 1) : roll(3, 2) ' roll(2, 4) 
D c D B D D 
D c c 
c B c 
B A B c B B 
A D . A A i A A 
before after ' before after i before after 


图 5-14 TE roll 函数 的 调用 示例 
编写 一 个 函数 ， 在 一 个 指定 的 栈 中 实现 roll (n,k): 


void roll(Stack«char» & stack, int n, int k) 

你 的 实现 应 该 检查 n 和 都 是 非 负 的 ， 并且 n 不 大 于 栈 的 大 小 。 如 果 违 反 了 其 中 的 任何 一 个 条 
件 ， 你 的 实现 应 该 调用 error 并 提供 以 下 消息 : . 
roll: argument out of range 


然而 ，k 可 以 比 n 大 ,在 这 种 情况 下 ，zol1 操作 将 会 持续 超过 一 个 完整 的 循环 。 图 5-14 最 后 举例 
说 明了 这 种 情况 ， 栈 项 的 两 个 元 素 滚动 了 四 次 ， 导 致 栈 中 的 内 容 和 开始 时 完全 一 样 。 


.你 可 以 扩大 图 5-5 中 所 示 的 结账 队列 仿真 来 研究 队列 是 如 何 排队 的 这 个 重要 的 实际 问题 。 首 先 ， 和 


超市 中 经 常 出 现 的 情况 一 样 ， 对 于 有 多 个 独立 的 队列 重 写 仿真 。 一 个 顾客 到 达 结账 台 的 区 域 时 ， 会 
寻找 最 短 的 结账 队列 ， 然 后 进入 这 个 队列 。 你 改进 的 仿真 应 该 和 本 章 中 的 仿真 报告 同样 的 结果 。 


. 作为 结账 队列 仿真 的 第 二 个 扩展 ， 修 改 上 述 习 题 中 的 程序 使 得 只 有 单个 队列 并 且 被 多 个 收银 员 服 务 


(近年 来 一 种 很 常见 的 形式 )。 在 仿真 的 每 个 循环 中 ,任何 收银 员 只 要 空 闪 了 ， 就 会 为 队列 中 下 一 个 
顾客 服务 。 如 果 你 比较 这 个 练习 题 与 之 前 习题 产生 的 数据 ， 对 于 组 织 一 个 结账 队列 的 这 两 种 方法 它 
们 各 自 具 有 的 优势 ， 你 有 什么 想 说 的 ? 


. 编写 一 个 程序 ， 对 下 面 的 试验 进行 仿真 。 这 个 试验 出 现在 1957 年 的 迪斯尼 电影 《原子 是 我 们 的 朋 


友 》( Our Friend the Atom) 中 ， 用 来 说 明 核 裂变 中 涉及 的 链 式 反 应 。 试 验 的 环境 是 一 个 立方 形 的 盒 

子 ， 这 个 盒子 的 底部 被 625 个 陷阱 完全 覆盖 ， 并 且 625 个 陷阱 形成 了 一 个 每 边 有 25 个 陷阱 的 正方 

形 。 每 个 陷阱 开始 的 时 候 填充 了 两 个 乒乓 球 。 在 仿真 开始 时 ， 一 个 额外 的 乒乓 球 从 盒子 顶部 释放 ， 

然后 落 到 一 个 陷阱 上 。 这 个 陷阱 被 触发 ， 然 后 使 其 自己 的 两 个 乒乓 球 弹 向 空气 中 。 这 两 个 乒乓 球 在 

盒子 的 侧面 跳跃 ， 最 终 落 在 盒 底 ， 在 落下 的 位 置 上 ， 它 们 可 能 触发 更 多 的 陷阱 。 

在 编写 这 个 仿真 的 过 程 中 ， 你 应 该 做 出 以 下 这 些 简化 的 假设 : 

© 每 一 个 乒乓 球 都 落 在 一 个 陷阱 上 ， 这 个 陷阱 是 通过 在 网 格 中 挑选 一 个 随机 的 行 和 列 来 随机 挑选 
的 。 如 果 这 个 陷阱 依旧 填充 了 乒乓 球 ， 那 么 会 将 其 乒乓 球 释放 到 空中 。 如 果 这 个 陷阱 早已 经 被 
触发 ， 落 入 一 个 球 对 其 没有 影响 。 

e 一 旦 一 个 球 落 入 一 个 陷阱 中 ， 无 论 这 个 陷阱 是 否 已 经 被 触发 ， 这 个 球 都 将 停止 ,并 且 不 会 对 接 
下 来 的 仿真 产生 影响 。 

© 从 陷阱 中 发 射 的 乒乓 球 在 盒子 的 空间 中 跳跃 ， 直 到 经 过 一 个 随机 的 时 间 间 隔 后 才 会 落下 。 这 个 
随机 的 间隔 对 于 每 一 个 乒乓 球 都 是 独立 的 ， 并 且 这 个 时 间 间 隔 总 是 处 于 一 个 到 四 个 循环 之 间 。 

你 的 仿真 应 该 一 直 运 行 ， 直 到 空中 没有 乒乓 球 。 在 那个 时 候 ， 程 序 应 该 报告 从 程序 开始 运行 到 现在 

一 共 经 过 了 多 长 时 间 ， 被 触发 陷阱 所 占 的 百分比 ， 以 及 在 仿真 过 程 中 空中 出 现 的 乒乓 球 的 最 大 数目 。 

1884 年 的 五 月 ， 萨 缪 尔 . 摩尔 斯 通过 电报 机 从 华盛顿 向 巴尔 的 摩 发 送 了 一 条 内 容 为 “上 帝 创 造 了 什么 ”的 

消息 ， 预 示 着 电子 通信 技术 时 代 的 来 临 。 为 了 能 够 让 只 使 用 单 音信 号 的 出 现 和 消失 来 交流 信息 ， 摩 尔 斯 设 

计 了 一 个 编码 系统 。 在 这 个 系统 中 ,字母 和 其 他 的 符号 表示 成 一 个 短 的 和 长 的 音调 编码 序列 ， 习 惯 上 称 

为 点 (dot) 和 破 折 号 (dash)。 在 摩尔 斯 编码 中 ,字母 表 中 的 26 个 字母 表示 为 如 图 5-15 所 示 的 编码 。 
编写 一 个 程序 ， 从 用 户 处 读 取 若 干 行 信息 ， 要 么 将 每 一 行 信息 翻译 为 摩尔 斯 编码 ， 要 么 将 摩尔 
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斯 编码 翻译 为 原 信息 ， 并 根据 每 一 行 的 首 字 符 对 每 一 行进 行 翻译 : 
e 如 果 这 行 以 一 个 字母 开始 ， 并 且 你 想 要 将 其 翻译 为 摩尔 斯 编码 。 除 了 26 个 字母 以 外 的 其 他 字符 
257 都 应 该 被 忽视 。 





5-15 ”摩尔 斯 编码 


e 如 果 这 一 行 以 一 个 原点 (点 ) 或 者 一 个 连 字 号 (BTS) 开始 ， 它 将 会 被 读 成 一 系列 的 摩尔 斯 编 
码 ， 并 且 你 需要 将 它们 翻译 为 字母 。 你 可 能 假设 : 在 输入 字符 串 中 每 一 个 点 和 破 折 号 的 序列 都 
以 空格 隔 开 ， 并 且 可 以 自由 地 忽视 任何 其 他 出 现 的 字符 。 由 于 单词 之 间 的 空格 没有 编码 ， 当 你 
的 程序 直接 翻译 时 ， 被 翻译 的 消息 的 所 有 字符 都 会 连 在 一 起 。 

当 用 户 输入 空 行 时 ,程序 停 止 运行 。 一 个 运行 该 程序 的 示例 (节选 自 泰坦 尼克 号 与 卡 帕 西亚 号 

之 间 的 消息 ) 可 能 如 下 图 所 示 : 








Morse code translator 
» SOS TITANIC 
n WE ARE SINKING FAST 


| 
eaten eme m aac ] 






20. 美国 和 加 拿 大 的 电话 号 码 被 组 织 成 不 同 的 三 位 区 号 (area code)。 一 个 单独 的 州 或 者 省 可 能 有 很 多 
个 区 号 ， 但 是 一 个 区 号 不 会 在 一 个 州 或 者 一 个 省 的 边界 上 交叉 。 这 个 规则 能 够 让 你 列 出 一 个 数据 
文件 中 每 个 区 号 的 地 理 位 置 。 对 于 这 个 问题 ， 假 设 你 能 够 使 用 一 个 名 为 AreaCodes.txt 的 文件 ， 
258 这 个 文件 列 出 了 每 个 区 号 及 其 对 应 的 位 置 ， 文 件 中 开始 的 几 行 如 下 图 所 示 : 


AreaCodes.txt 


201-New Jersey 
202-District of Columbia 


203-Connecticut 
204-Manitoba 
205-Alabama 
206-Washington 





使 用 图 5-7 中 的 程序 AirportCodes 作为 一 个 模型 ， 编 写 必要 的 代码 将 这 个 文件 读 取 到 一 个 
Map<int,string> 对 象 中 ,这 个 对 象 的 键 是 区 号 ， 值 是 对 应 的 位 置 。 一 旦 读 取 完 数据 ， 编 写 一 
个 主 程序 ， 让 用 户 反 复 地 输入 区 号 ， 然 后 查阅 对 应 的 位 置 ， 如 以 下 示例 运行 结果 : 


650 
California 
Enter area code or state name: 202 


District of Columbia 
Enter area code or state name: 778 
British Columbia 
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21. 


22. 


23. 


24. 


25. 


然而 ， 提 示 表 明 ， 程 序 也 应 该 允许 用 户 输入 州 或 者 省 的 名 字 ， 然 后 列 出 所 有 服务 该 地 区 的 区 
号 ， 如 以 下 示例 运行 结果 : 





当 你 为 之 前 的 习题 编写 FindAreaCode 程序 时 ， 通 过 查找 整个 地 图 为 某 个 州 产 生 其 区 号 列表 ， 并 
且 打印 出 映射 到 那个 州 的 任意 区 号 。 尽 管 这 种 策略 对 于 像 区 号 实例 这 种 小 的 地 图 是 合适 的 ， 但 这 种 
策略 在 针对 很 大 的 数据 地 图 时 效率 将 会 是 一 个 问题 。 

一 个 可 选择 的 方法 是 使 映射 的 关键 字 与 值 反 转 ， 以 便 你 可 以 在 任何 一 个 方向 上 执行 查询 操作 。 
然而 ， 你 不 可 以 声明 一 个 形 如 Map<string, int> 的 映射 反 转 ， 因 为 对 于 一 个 州 ， 这 里 经 常 有 超 
过 一 个 的 区 号 与 其 对 应 。 替 代 的 方法 是 将 反 转 的 映射 声明 为 一 个 Map<string,Vector<int>> 
对 象 ， 以 便 这 个 map 能 够 将 每 个 州 的 名 字 与 服务 该 州 的 区 号 匹配 。 重 写 程序 FindAreaCode 以 便 
在 读 取 完 数据 文件 之 后 ， 程 序 创建 了 一 个 反 转 的 上 映射， 然后 使 用 这 个 映射 列 出 一 个 州 的 区 号 。 

3.6 节 定 义 了 一 个 名 为 tsPalindrome 的 函数 来 检查 一 个 单词 从 前 和 从 后 读 是 否 是 一 样 的 。 将 这 
个 函数 与 英语 字典 一 起 使 用 ， 列 出 所 有 的 回 文 单词 。 

在 一 种 名 为 Scrabble 的 拼 字 游戏 中 ， 已 知 由 两 个 字母 构成 的 单词 列表 是 很 重要 的 ， 因 为 那些 短 的 单词 
使 得 它 易于 “ 钓 出 ”一 个 已 存在 的 新 的 单词 。 拼 字 游 戏 所 产生 的 另 一 个 由 三 个 字符 所 构成 的 单词 列 
表 ， 它 由 在 二 个 字符 所 构成 的 单词 的 前 面 或 者 后 面 增加 一 个 字符 形成 。 编 写 能 够 生成 该 列表 的 程序 。 
Scrabble 拼 字 游戏 最 重要 的 策略 性 原则 就 是 保存 你 的 s 构造 块 ， 因 为 英语 单词 的 复数 规则 是 许多 单 
词 以 s 结 尾 。 当 然 ， 某 些 单词 ,大约 有 680 个 单词 ， 允 许 只 在 其 单词 后 添加 一 个 s 便 可 构造 出 一 个 
新 的 单词 ， 例 如 ， 单 词 cold 和 hot。 编 写 一 个 程序 ， 产 生 所 有 符合 条 件 的 单词 列表 。 

编写 一 个 程序 显示 一 个 表格 。 它 根据 单词 的 长 度 进行 排序 ， 并 展示 了 不 同 长 度 的 单词 在 英文 字典 中 
出 现 的 次 数 。 对 于 EnglishWords .dat 中 的 字典 ， 这 个 程序 的 输出 如 下 图 所 示 : 
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类 的 设计 





你 不 会 理解 ， 也 许 我 有 类 ……: 
一 一 马龙 白兰 度 在 影片 《码头 风云 》 中 的 角色 ，1954 


虽然 你 已 经 广泛 地 使 用 了 本 书 中 大 量 的 类 ， 但 是 还 没有 定义 过 自己 设计 的 类 。 本 章 的 
目标 就 是 通过 提供 给 你 实现 新 类 所 需 的 一 些 工 具 从 而 弥补 这 一 空缺 。 但 是 本 章 仅 呈 现 自 定 义 
类 的 一 些 基 础 。 在 后 续 的 章节 中 ， 你 将 有 机 会 学 习 类 设计 的 其 他 重要 方面 ， 包 括 内 存 管 理 和 
继承 。 


6.1 二 维 点 的 表示 


类 的 有 用 特性 之 一 (但 绝 不 是 唯一 的 一 个 ) 在 于 它 能 将 几 个 相关 的 信息 片断 组 织 成 一 个 
复合 值 ， 使 你 可 以 整体 地 对 其 进行 操作 。 举 一 个 简单 的 例子 ， 你 正在 对 x 一 y 网 格 坐 标 系 上 
的 坐标 进行 操作 ， 其 中 ,x 和 yy 坐标 值 均 为 整数 。 虽 然 你 可 以 将 x 和 yy 的 值 独立 处 理 ， 但 是 
定义 一 种 抽象 数据 类 型 将 x All y 的 值 组 合 在 一 起 会 更 方便 。 在 几何 学 中 ， 这 一 对 坐标 点 值 称 
为 点 (point)， 因 此 ， 将 这 一 数据 类 型 命名 为 Point 将 更 有 意义 。C++ 语言 提供 了 几 种 策略 
来 定义 Point 类 型 ， 其 范围 包括 从 C 语言 家 族 提供 的 简单 结构 类 型 到 采用 现代 的 面向 对 象 
设计 风格 的 自 定义 类 型 。 以 下 各 节 将 逐步 探索 这 些 策略 ， 首 先 从 基于 结构 的 模型 开始 ， 然 后 
再 到 基于 类 的 模式 。 


6.1.1 % Point 定义 为 结构 类 型 


在 以 前 的 编程 中 ， 你 几乎 肯定 接触 过 将 几 个 已 存在 的 简单 类 型 数值 组 合 在 一 起 ， 称 作 记 
录 (record) 或 结构 (structure) 的 数据 类 型 。 其 中 ， 记 录 这 一 术语 在 计算 机 科学 领域 中 使 用 
得 更 为 广泛 ， 而 第 二 个 术语 结构 则 在 C++ 程序 员 中 更 为 普遍 。 若 C++ 支持 已 有 的 C 语言 机 
制 ， 你 就 可 以 采用 C 语言 风格 的 结构 定义 将 Point 类 型 定义 为 结构 类 型 : 
struct Point ( 
int x; 


int y; 
) 


这 段 代码 将 Point 类 型 定义 成 具有 两 个 分 量 的 传统 结构 类 型 。 在 一 个 结构 中 ， 其 分 量 称 为 
域 (field) 或 成 员 ( member)。 在 本 例 中 ，Point 结构 分 别 包 括 了 名 字 分 别 为 x 和 y 的 两 个 
域 ， 它 们 均 为 int 类 型 。 

当 你 在 C++ 语言 中 采用 结构 或 类 时 ， 你 应 该 时 刻 牢记 : 新 的 定义 只 是 引入 了 一 种 新 的 
数据 类 型 ， 并 没有 声明 任何 变量 。 一 旦 有 了 数据 类 型 的 定义 ， 你 就 可 以 像 使 用 其 他 类 型 一 样 
声明 该 类 型 变量 。 例 如 ， 如 果 你 在 一 个 函数 中 有 如 下 局 部 变量 声明 : 


Point p; 
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编译 器 将 会 在 栈 帧 中 为 Point 类 型 变量 p 分 配 存储 空间 ， 正 如 以 下 声明 语句 : 

int n; 
将 在 栈 帧 中 为 int 类 型 的 变量 n 分 配 存储 空间 一 样 。 上 述 两 个 声明 语句 的 唯一 不 同 在 于 
Point 类 型 变量 p 中 包含 了 内 部 域 x 和? 的 值 。 若 画 一 个 变量 p 的 盒 图 ， 它 看 起 来 如 下 图 
所 示 : 





变量 p 中 拥有 一 个 组 合 值 ， 即 其 内 部 域 x 和 y 的 值 。 

给 定 一 个 结构 类 型 的 变量 ,可 以 采用 下 述 方式 使 用 点 操作 符 来 选择 其 中 的 某 个 域 : 
其 中 ，var 是 一 个 结构 体 变量 ， 而 name 是 欲 选取 的 某 个 域名 。 例 如 ， 可 以 通过 表达 式 p .x 
和 p.y 来 访问 存储 在 Point 类 型 变量 p PRE x A y 的 坐标 值 。 选 择 表达 式 是 可 赋值 的 ， 
因此 ， 可 以 通过 下 面 的 代码 初始 化 变量 p 的 各 成 员 值 ， 以 表示 点 (2,3): 


p.x = 2; 
P-y = 3; 


上 述 语句 使 得 变量 p 的 状态 如 下 图 所 示 : 





结构 类 型 最 基本 的 特性 就 是 你 可 以 将 其 看 作 一 组 独立 数据 域 的 集合 ， 并 将 其 整体 看 作 一 
个 值 。 在 结构 类 型 的 底层 实现 中 ， 存 储 于 结构 体 各 个 域 中 的 成 员 值 可 能 是 最 重要 的 。 但 是 在 
其 细节 的 更 高 层次 上 ， 我 们 更 关注 将 结构 作为 一 个 整体 看 待 。 

C++ 语言 通过 将 一 个 结构 作为 整体 看 待 ， 并 为 其 定义 一 组 重要 操作 ， 使 其 从 更 高 的 层次 
上 更 易于 维护 。 例 如 ， 假 定 已 有 一 个 Point 类 型 值 ， 你 可 以 把 该 值 赋 给 一 个 Point 类 型 的 
变量 ， 或 者 将 它 作 为 参数 传递 给 一 个 函数 ， 或 者 将 其 作为 函数 的 返回 值 。 同 样 ， 用 户 可 以 选 
择 该 变量 的 x 域 或 者 y 域 以 单独 访问 其 成 员 值 。 但 通常 将 其 看 作 一 个 整体 使 用 已 经 足够 了 。 
结构 类 型 的 设计 决策 意味 着 你 可 以 在 应 用 的 不 同 层面 来 传递 一 个 结构 类 型 变量 。 但 是 除非 结 
构 类 型 在 最 底层 ， 否 则 其 底层 实现 细节 并 不 重要 。 


6.1.2 将 Point 定义 为 类 


虽然 结构 类 型 是 C++ 语言 历史 的 一 部 分 ， 甚 至 比 C++ 语言 本 身 更 早出 现 ， 但 是 它 已 经 
在 很 大 程度 上 被 更 强大 灵活 的 类 所 取代 。 前 面 小 节 中 的 Point 结构 类 型 与 下 面 的 类 定义 完 
全 相同 : 


class Point { 
public: 

int x; 

int y; 
}; 
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正如 你 从 这 个 例子 中 所 看 到 的 ， 对 于 类 中 的 域 一 一 也 称 为 实例 变量 ( instance variable), 
其 声明 与 结构 类 型 中 域 的 声明 语法 相同 。 两 者 唯一 的 语法 差别 在 于 类 中 的 域 又 划分 成 公有 
部 分 和 私有 部 分 ， 以 控制 程序 对 这 些 域 的 访问 权限 。 关 键 字 public 引 入 了 类 的 公有 部 分 
(public section)， 其 中 所 包含 的 域 对 于 该 类 的 所 有 用 户 而 言 都 是 可 访问 的 。 然 而 在 一 个 类 的 
定义 中 ， 还 可 以 包括 由 private 关键 字 标 识 的 类 的 私有 部 分 (private section)。 声 明 在 私 
有 部 分 的 域 仅 对 该 类 本 身 可 见 ， 而 对 其 他 的 任何 用 户 不 可 见 。 在 如 今 的 C++ 版 本 中 ， 结 构 
类 型 和 类 基本 上 以 同样 的 方式 实现 ， 唯 一 的 不 同 在 于 结构 的 入 口 默 认 访 问 权 限 是 public, 
而 类 的 入 口 默认 访问 权限 是 private。 

正如 现在 Point 类 的 定义 ，x M y 域 处 于 类 的 公有 部 分 ， 它们 对 类 的 用 户 可 见 。 可 
以 使 用 点 操作 符 来 选择 该 类 对 象 中 的 公有 域 。 例 如 ， 如 果 有 一 个 Point 类 的 对 象 pt， 即 
Point 类 的 一 个 实例 ， 可 以 通过 以 下 方法 来 选取 其 中 的 x 域 : 


pt.x 


264] 这 正和 前 面 章节 中 访问 Point 结构 类 型 的 方法 一 样 。 

然而 ， 现 代 面 向 对 象 编程 不 鼓励 在 类 中 声明 public 的 实例 变量 。 今天， 通常 的 做 
法 是 将 类 中 的 所 有 实例 变量 都 声明 为 private， 这 意味 着 用 户 不 能 直接 访问 类 中 的 这 
些 内 部 变量 。 用 户 只 能 通过 类 中 的 public 方法 来 间接 地 访问 类 中 内 部 变量 的 值 。 正 如 
第 5 章 所 介绍 的 ， 我 们 将 实现 细节 与 用 户 相 隔离 ， 这 保证 了 程序 的 简洁 性 、 灵 活性 和 安 
全 性 。 

使 得 类 中 的 实例 变量 变 为 private 非常 容易 ， 你 仅 须 将 访问 权限 从 public 变 为 
private 即 可 ， 如 下 所 示 : 


class Point { 
private: 
int x; 
int y; 


b 


这 一 定义 存在 的 问题 是 用 户 将 永远 无 法 访问 Point 类 型 对 象 中 存储 的 信息 ， 这 使 得 该 定义 
形式 的 Point 类 无 法 使 用 。 用 户 至 少 需要 某 种 方式 去 创建 Point 对 象 ， 并 能 从 中 单独 地 获 
取 其 x 或 ?的 坐标 值 。 

正如 你 在 第 5 章 中 所 学 到 的 ， 创 建 对 象 是 构造 函数 (constructor) 的 责任 ， 其 构造 函数 
名 与 类 名 完全 一 样 。 类 通常 定义 了 多 个 构造 函数 以 适应 其 多 种 初始 化 对 象 的 方式 。 特别 是 ， 
大 多 数 类 都 定义 了 无 参数 的 构造 函数 ， 它 称 为 默认 构造 函数 (default constructor), KAR 
认 构 造 函 数 在 初始 化 对 象 时 无 须 提供 参数 列表 。 在 Point 类 中 ， 定义 一 个 获取 一 对 二 维 坐 
标 值 的 构造 函数 是 非常 有 用 的 。 

在 计算 机 科学 中 ， 获 取 实 例 变 量 值 的 函数 一 般 称 为 访问 器 (accessor)， 亦 通常 称 为 读 取 
器 (getter)。 为 方便 起 见 ， 读 取 器 的 命名 通常 以 单词 get AMA, 后跟 首 字母 大 写 的 实例 变 
HZ. AIE, Point 类 的 读 取 器 名 为 getX 和 getY。 

为 了 保持 本 书 先 举例 ， 然 后 再 详细 解释 示例 中 出 现 的 每 一 个 新 概念 的 一 贯 策略 ， 图 6-1 
展示 了 Point 类 的 核心 定义 ， 其 中 包括 具有 public 访问 权限 的 两 个 构造 函数 ，getX 和 
gety FE, UR toString 方法。 在 此 例子 中 ,已 经 省 略 了 用 以 说 明 类 定义 结构 以 及 类 中 

[65] 方法 的 相关 注释 。 
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* This class represents an x-y coordinate point on a two-dimensional 
* integer grid 


#include <string> 
#include "strlib.h" 
using namespace std; 


class Point { 


Point() { 
x = 0; 
y= 0, 

} 


> Constructors 
Point (int xc, int yc) { | 


x = XC; 
y = yc; 
! d 
int getX() 4 i > Public section 
return x; H 


) 


int getY() ( 
return y; 


) 


string toString() ( 
return "(" + integerToString(x) + ", 
* integerToString(y) * ")"; 


Getter methods 


| private: 1 
int x; |) Private section 
1 





图 6-1 Point 类 的 简单 版 本 


图 6-1 所 示 的 大 部 分 代码 应 该 很 容易 理解 。 唯 一 难以 理解 并 可 能 引起 混淆 的 是 第 二 个 构 
造 函 数 的 形 参 名 。 人 逻辑 上 ， 如 果 构 造 函 数 需 要 分 别传 人 一 个 x 和 y 坐标 值 ， 那 么 构造 函数 的 
形 参 名 应 毫 无 疑问 应 为 x My, MAL xc 和 yc (这 里 的 字母 代表 单词 coordinate)。 遗 憾 
的 是 ， 若 在 这 里 使 用 x 和 y 来 命名 构造 函数 的 参数 将 使 对 变量 的 指 代 发 生 歧 义 ， 即 无 法 分 
辩 是 对 形 参 变量 x 的 引用 ， 还 是 对 类 对 象 的 同名 实例 变量 的 引用 。 

程序 代码 内 层 块 中 的 变量 隐藏 外 层 块 中 同名 变量 的 行为 称 为 遮蔽 (shadowing)。 在 第 11 
章 ， 你 将 学 习 解决 该 二 义 性 的 一 种 简单 技术 ， 但 遗憾 的 是 ， 该 技术 所 需 的 概念 已 超出 了 你 的 
知识 范围 。 因 此 ， 本 书 中 的 例子 暂时 通过 为 形 参 和 实例 变量 选取 不 同 的 名 称 以 避免 参数 遮蔽 
这 一 问题 。 

在 阅读 了 图 6-1 所 示 的 程序 代码 后 ， 你 可 能 会 产生 另 一 个 问题 : 为 什么 类 中 没有 包含 
一 些 其 他 的 方法 ? 虽然 读 取 器 方法 允许 我 们 获得 Point 类 对 象 中 的 信息 ， 但 是 该 类 并 没 
有 提供 更 新 这 些 域 值 的 方法 。 为 此 ， 在 某 些 情况 下 ， 一 种 有 效 的 办 法 就 是 在 类 中 对 外 提供 
为 特定 的 实例 变量 设置 值 的 方法 。 这 样 的 方法 称 为 设 值 方法 ( mutator)， 通 常 也 称 为 设 值 器 
( setter)。 如 果 Point 类 对 外 提供 了 setx 和 setY 方 法 以 允许 用 户 改 变相 应 域 的 值 ， 那 么 
你 就 能 很 容易 地 将 之 前 使 用 旧版 本 结构 类 型 的 Point 类 型 替换 为 全 新 的 Point 类 版 本 。 而 
你 所 要 做 的 就 是 将 以 下 形式 的 每 一 个 赋值 语句 : 


pt.x - value; 
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更 改 为 如 下 形式 的 方法 调用 : 


pt.setX(value); 


类 似 地 ， 每 一 个 不 作为 赋值 语句 中 的 左 值 而 对 pt .y 变量 的 引用 ， 必 须 重 写 为 pt .getY( )。 

然而 ， 在 刚刚 认识 到 设置 实例 变量 的 访问 权限 为 私有 的 重要 性 时 ， 你 可 能 会 觉得 在 类 中 
增加 设置 器 这 一 行为 是 不 可 取 的 。 毕 竟 ， 将 实例 变量 的 访问 权限 设置 为 私有 部 分 的 原因 是 为 
了 阻止 用 户 不 受 任何 约束 地 访问 这 些 变 量 。 因 此 ， 为 类 中 的 每 个 实例 变量 编写 一 个 具有 公共 
访问 权限 的 设置 器 将 赋予 用 户 绕 过 类 中 所 设 的 约束 权限 ， 并 将 抵消 程序 员 在 开始 时 将 实例 变 
量 访 问 权限 设置 为 私有 所 带 来 的 优势 。 通 常 ， 只 允许 用 户 读 取 实 例 变量 值 会 比 允 许 用 户 改变 
其 值 更 安全 。 因 此 ， 在 面向 对 象 程序 设计 中 ， 读 取 器 比 设置 器 更 为 常见 。 

事实 上 ， 许 多 程序 员 采 取 在 更 高 的 层次 上 将 类 设计 为 完全 不 可 更 改 的 建议 ， 即 一 旦 对 象 
被 创建 ， 其 实例 变量 值 不 可 改变 。 这 种 设计 风格 的 类 称 为 是 不 可 变 的 〈immutable)。Point 
类 就 是 不 可 变 的 ， 至 少 在 C++ 语言 的 定义 中 是 倾向 于 不 可 变 的 。 虽 然 我 们 还 可 以 通过 将 
一 个 Point 类 对 象 赋 给 另 一 个 Point 对 象 以 改变 其 内 容 ， 但 是 我 们 无 法 单独 地 改变 一 个 
Point 对 象 中 的 各 个 域 值 。 


6.1.3 ”接口 与 实现 的 分 离 


只 有 在 图 6-1 中 展示 的 Point 类 与 使 用 该 类 的 代码 放 在 同一 个 源 文件 的 情况 下 ， 它 才 
能 发 挥 作 用 。 通 常 ， 在 类 库 中 提供 了 类 的 定义 ， 并 使 得 这 一 定义 可 以 应 用 于 大 多 数 的 情况 ， 
这 是 更 好 的 做 法 。 为 此 ， 你 必须 创建 一 个 point .h 文件 以 表示 类 的 接口 ， 而 另 一 个 分 开 的 
point.cpp 文件 包含 了 相应 的 类 的 实现 。 

正如 你 在 第 2 章 所 看 到 的 ， 接 口 通常 只 包含 函数 的 原型 而 不 包含 其 完整 的 实现 ， 这 同 
样 适 用 于 类 中 的 方法 。 类 的 接口 定义 只 包含 方法 原型 ， 而 将 其 具体 代码 推迟 到 其 实现 中 。 因 
此 ， 类 的 头 文件 与 其 他 类 库 的 头 文件 是 类 似 的 ， 唯 一 的 不 同 在 于 : 对 类 而 言 ， 方 法 原型 定义 
在 类 中 。 但 是 类 的 实现 文件 结构 与 类 库 相 比 却 是 不 同 的 。 

在 C++ 中 ， 当 将 类 的 接口 与 实现 进行 分 离 时 ， 类 自身 的 定义 仅 存 在 于 它 的 .h 文件 中 。 
其 对 应 的 实现 放 在 .cpp 文件 中 ， 它 作为 独立 方法 定义 ， 而 不 像 方 法 原型 嵌 套 在 类 的 定义 
中 。 因 此 ， 这 些 方 法 的 定义 必须 以 不 同 的 方式 表明 自己 属于 哪个 类 。 在 C++ 中 ， 通 过 在 方 
法 名 前 添加 类 名 作为 限定 符 (qualifier)， 并 使 用 双 冒 号 分 隔 类 名 与 方法 名 。 因 此 ，Point 类 
中 的 getX 方法 全 名 是 Point: :getX。 

一 旦 排除 了 小 小 的 语法 瑕 普 ， 类 的 实现 代码 对 你 就 没有 任何 障碍 。 图 6-2 提供 了 
Point 类 的 完整 接口 ， 其 对 应 的 实现 代码 显示 在 图 6-3 中 。 


/* 
* File: point.h 
* 


* This interface exports the Point class, which represents a point on 
* a two-dimensional integer grid. 


*/ 


#ifndef point h 
#define point h 


#include <string> 


class Point { 





图 6-2 Point 类 的 初步 接口 
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public: 
/* 


Constructor: Point 
Usage: Point origin; 
Point pt(xc, yc); 


* Creates a Point object. The default constructor sets the coordinates 
* to 0; the second form sets the coordinates to xc and yc. 


xy 
Point(); 
Point(int xc, int yc); 


/* 
* Methods: getX, getY 
* Usage: int x pt.getx(); 
pt.getY(); 


Return the x and y coordinates of the point, respectively. 


*/ 
int getX(); 
int getY(); 


/* 
* Method: toString 


* Usage: string str pt.toString(); 
* 


* Returns a string representation of the Point in the form "(x,y)". 
at 


std::string toString(); 
private: 


int x; /* The x-coordinate */ 
int y; /* The y-coordinate */ 


) 
fendif 
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point . cpp 


* This file implements the point.h interface. 
ay 


#include <string> 
#include "point.h" 
#include "strlib.h" 
using namespace std; 


/* 


Implementation notes: Constructors 


The constructors initialize the instance variables x and y. In the 
second form of the constructor, the parameter names are xc and yc 
to avoid the problem of shadowing the instance variables. 


*/ 


Point::Point() ( 
x - 0; 
y = 0; 

} 


Point: :Point (int xc, int yc) ( 
x = xc; 
y = ye; 


} 
/* 


* Implementation notes: Getters 
* L—————————————---- 二 一 一 一 一 一 一 一 一 一 一 





图 6-3 Point 类 的 初步 实现 
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* The getters return the value of the corresponding instance variable. 
* No setters are provided to ensure that Point objects are immutable. 
af 
int Point::getX() { 
return x; 


) 


int Point::getY() ( 
return y; 


/* 


Implementation notes: toString 


* 
* 


* The implementation of toString uses the integerToString function 
* from the strlib.h interface. 
Ww 
string Point::toString() { 
return "(" + integerToString(x) + "," + integerToString(y) + ")"; 
) 





图 6-3 (48) 


6.2 REFER 


通过 之 前 章节 关于 类 库 的 经 验 已 知 ，C++ 允许 我 们 扩展 标准 操作 符 使 其 适用 于 新 的 数据 
类 型 。 这 一 技术 称 为 操作 符 重 载 ( operator overloading)。 例 如 ，string 类 重 载 了 十 操作 符 ， 
使 + 操作 符 能 应 用 到 字符 串 上 ， 以 产生 与 其 在 基本 类 型 上 不 同 的 效果 。 当 C++ 编译 器 看 到 + 
操作 符 时 ， 它 会 根据 + 操作 符 操作 数 的 类 型 来 确定 其 操作 语义 ， 这 一 行为 与 通过 参数 签名 来 
决定 使 用 哪个 重 载 版 本 的 函数 类 似 。 如 果 C++ 编译 器 检测 到 十 操作 符 作用 于 两 个 整数 ， 那 
么 它 将 执行 两 个 整数 相 加 并 产生 整数 结果 的 指令 。 如 果 操 作对 象 是 stringi, arkir 
将 产生 对 string 类 中 提供 的 重 载 函 数 + 的 调用 来 实现 字符 串 的 连接 。 

操作 符 重 载 是 C++ 语言 的 一 个 强大 特性 ， 这 一 特性 使 得 程序 更 易于 阅读 ， 但 前 提 是 每 
一 种 操作 符 对 各 种 类 型 的 解释 是 一 致 的 。 重 载 了 + 操作 符 的 类 使 用 这 一 操作 符 来 实现 概念 上 
与 加 法 相似 的 操作 ， 例 如 连接 字符 串 。 对 两 个 string 类 型 变量 ,编写 以 下 表达 式 : 


sl + s2 


我 们 可 以 很 容易 地 理解 这 一 操作 : 它 将 两 个 字符 串 串 接 到 一 起 ， 形 成 一 个 新 的 字符 串 。 但 
是 ， 如 果 你 重新 定义 了 让 读者 无 法 理解 其 语义 的 操作 符 ， 则 操作 符 重 载 会 使 程序 变 得 星 涩 难 
懂 。 因 此 ， 学 会 有 限制 地 使 用 操作 符 重 载 这 一 特性 以 提高 程序 的 可 读 性 显得 尤为 重要 。 

以 下 各 节 将 说 明 怎 样 在 你 自己 定义 的 类 中 实现 操作 符 重 载 ， 我 们 将 以 6.1 节 中 的 Point 
类 作为 该 示例 的 开始 ， 然 后 对 第 1 章 中 引入 的 Direction 类 增加 一 些 有 用 的 操作 符 以 进行 
操作 符 重 载 的 实践 。 


6.2.1 重 载 插 入 操作 符 


正如 你 在 图 6-2 所 示 的 文件 point.h 接口 中 看 到 的 ，Point 类 提供 了 toString X 
法 ， 它 将 Point 对 象 中 包含 的 信息 转换 成 由 一 对 圆 括号 括 起 来 的 坐标 值 字符 串 。 引 入 这 一 
方法 的 主要 是 为 了 更 容易 地 显示 Point 类 对 象 的 值 。 当 调试 一 个 程序 时 ， 显 示 一 个 变量 的 
值 通常 可 以 带 来 便利 。 为 了 显示 Point 类 型 变量 pt 的 值 ， 所 要 做 的 就 是 在 程序 中 添加 以 
下 语句 : 
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cout << "pt = " << pt.toString() << endl; 


操作 符 重 载 可 以 进一步 简化 这 一 过 程 。C++ 已 经 重 载 了 流 插入 操作 符 <<， 以 便 它 可 以 
显示 字符 串 及 基本 类 型 数据 。 如 果 你 重 载 了 这 一 操作 符 以 支持 Point 类 ， 可 以 将 上 述 语句 
简化 为 : 


cout << "pt = " << pt << endl; 


这 只 是 一 个 细微 的 改变 ， 但 输出 一 个 点 的 值 也 因此 更 加 简便 。 

C++ 中 的 每 一 个 操作 符 都 与 定义 其 重 载 操作 符 行 为 的 重 载 函 数 名 相关 。 大 多 数 情况 下 ， 
重 载 函 数 名 由 关键 字 operator 后 跟 操 作 符 构成 。 例 如 ， 如 果 你 想 为 某 种 新 类 型 重新 定义 
操作 符 +， 你 必须 定义 一 个 名 为 operator+ 的 函数 ， 并 传人 该 类 型 的 实 参 。 类 似 地 ， 可 以 271 
通过 重新 定义 函数 operator<< 来 重 载 插入 操作 符 。 

编写 operator«« 函数 时 遇 到 的 最 大 挑战 是 如 何 给 这 个 函数 编写 函数 原型 。<< 操作 符 
的 左 操 作 数 是 一 个 输出 流 , 但 <iostream> 类 库 中 已 经 定义 了 一 个 完整 的 输出 流 层次 结构 。 
在 大 多 数 情况 下 ， 使 用 最 通用 的 类 来 实现 必要 的 操作 是 一 个 很 好 的 选择 。 在 输出 流 层次 结构 
中 , 最 通用 的 类 是 ostream。<< 操作 符 的 右 操 作 数 是 你 想 要 做 和 到 输出 流 中 的 Point 类 
对 象 的 信息 。 因 此 ，<< 操作 符 的 重 载 定 义 需 要 传人 两 个 实 参 : 一 个 是 ostream 类 型 ， 另 
一 个 是 Foint 类 型 。 

然而 ， 完 成 该 函数 原型 你 还 需 考虑 这 种 情况 : 流 对 象 是 不 能 拷贝 的 。 这 一 约束 意味 着 
ostream 类 型 参数 必须 采用 引用 传递 。 同 样 地 ， 这 一 约束 也 在 插 人 操作 符 << 返回 时 产生 
影响 。 正 如 在 本 章 开 头 所 介绍 的 那样 ， 插 入 操作 符 通 过 返回 输出 流 在 连接 流 语句 中 起 到 重要 
作用 ， 其 返回 结果 可 以 参与 到 链 中 的 下 一 个 << 操作 符 运算 。 为 了 避免 在 该 操作 过 程 结束 后 
拷贝 流 ，operator<< 的 定义 也 必须 通过 引用 来 返回 结果 。 

通过 引用 来 传递 函数 参数 要 比 通过 引用 来 返回 函数 结果 要 常见 得 多 。 类 似 刚 才 的 << 操 
作 符 重 载 例 子 ， 对 于 那些 通过 引用 返回 结果 的 应 用 ， 你 只 需要 知道 定义 引用 返回 与 定义 引用 
参数 传递 的 语法 大 致 相同 : 只 需要 在 函数 返回 类 型 后 面 加 上 一 个 & 符号 即 可 。 

综合 上 述 要 点 ， 我 们 应 该 像 下 面 这 样 定 义 operator<< 函数 的 重 载 版 本 : 


ostream & operator<<(ostream & os, Point pt); 


该 函数 的 实现 必须 在 输出 流 中 输出 pt 对 象 的 字符 串 表示 ， 然 后 通过 引用 返回 这 个 流 ， 使 得 
该 流 可 以 在 程序 中 继续 使 用 。 如 果 依 次 实现 了 这 些 步 骤 ， 会 得 到 以 下 代码 : 
ostream & operator<<(ostream & os, Point pt) ( 
os «« pt.toString(); 


return os; 


) 
然而 ， 也 可 以 像 下 面 这 样 将 上 述 实现 精简 为 一 行 代码 : 


ostream & operator<<(ostream & os, Point pt) { 
return os «« pt.toString(); 
) 272 
本 书 中 定义 的 类 均 使 用 了 上 述 第 二 种 形式 的 代码 ， 它 重点 强调 了 << 操作 符 返回 输出 流 这 一 
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6.2.2 判断 两 个 点 是 否 相等 


如 果 你 阅读 过 Standford 类 库 中 最 终 版 本 的 point.h 接口 ， 你 会 发 现 Point 类 除了 提 
供 流 插入 操作 之 外 ， 还 提供 了 其 他 操作 符 。 例 如 ， 给 定 两 个 点 pl Mp2, TARH == 操作 
符 来 判断 这 两 个 点 是 否 相 等 ， 这 与 检验 字符 串 和 基本 类 型 是 否 相 等 一 样 。 

C++ 提供 了 两 种 机 制 用 以 重 载 内 置 的 操作 符 ， 以 保证 它们 可 适用 于 新 定义 类 的 对 象 : 

1. 可 以 在 类 中 用 一 个 方法 来 重 载 一 个 操作 符 。 当 采用 这 种 方式 在 类 中 重 载 一 个 二 元 操作 
符 时 ， 其 左 操作 数 为 该 类 型 的 对 象 ， 而 右 操作 数 则 作为 形 参 传 递 进 来 。 

2. 可 以 在 类 外 使 用 一 个 自由 函数 (free function) 来 重 载 定义 一 个 操作 符 。 如 果 采 用 这 种 
方式 ， 则 二 元 操作 符 的 两 个 操作 数 都 必须 通过 形 参 传递 进来 。 

如 果 采 用 基于 方法 的 操作 符 重 载 方 法 ,在 Point 类 中 重 载 == 操作 符 的 第 一 步 就 是 在 
K point.h 接口 中 增加 == 操作 符 的 函数 原型 ， 如 下 所 示 : 


bool operator--(Point rhs); 


该 方法 是 Point 类 的 一 部 分 ， 因 此 必须 定义 在 公有 部 分 。 相 关 的 实现 将 放置 在 point . 
cpp 文件 中 ,其 中 可 能 需要 增加 如 下 代码 : 
bool Point::operator--(Point rhs) ( 


return x == rhs.x && y == rhs.y; 


) 


与 类 中 通过 其 接口 导出 的 其 他 方法 一 样 ，operator== 的 实现 必须 通过 在 方法 名 中 增加 
Point:: 前 缀 来 声明 其 属于 Point 类 。 
调用 这 个 方法 的 用 户 代 码 看 起 来 如 下 所 示 : 


if (pt == origin) ... 


假设 pt Ñl origin 均 为 Point 类 型 的 变量 ， 编 译 器 在 执行 pt==origin 表达 式 时 ， 
会 从 Point 类 中 调用 == 操作 符 。 因 为 operator== 是 一 个 方法 ， 所 以 ， 编 译 器 将 把 变 
E pt 指派 为 接收 者 ， 并 拷贝 origin 变量 的 值 传送 给 形 参 rhs。 在 operator== 方 法 体 
中 ,无 任何 限制 符 的 变量 x 和 y 是 指 变量 pt 的 数据 域 , 而 rhs .x 和 rhs.y 指 的 是 变量 
origin 的 数据 域 。 

operator== 方法 的 代码 展示 了 面向 对 象 编程 的 一 个 重要 特性 。operator== 方法 显 
然 可 以 访问 当前 对 象 的 x 和 y 域 ， 因 为 一 个 类 中 的 任意 方法 可 以 访问 该 类 的 私有 变量 。 其 
中 比较 难 理解 的 一 点 是 ， 为 何 operator== 方法 在 所 属 对 象 完全 不 同 的 情况 下 也 可 以 同时 
访问 rhs 对 象 的 私有 变量 。 在 C++ 中 ， 这 种 引用 是 合法 的 ， 因 为 类 中 定义 的 私有 部 分 对 该 
类 来 说 是 私有 的 ， 但 对 对 象 而 言 并 非 如 此 。 类 中 方法 的 代码 可 以 引用 该 类 型 的 任何 对 象 的 实 
例 变量 。 

根据 我 的 经 验 ， 学 生 通 常会 对 基于 方法 形式 的 操作 符 重 载 感到 迷惑 ， 因 为 编译 器 处 理 左 
操作 数 和 右 操 作 数 的 方式 是 不 同 的 ， 它 会 把 左 操作 数 指派 为 接收 者 ， 并 将 右 操作 数 以 形 参 传 
弟 进 来 。 恢 复 这 一 操作 数 对 称 性 的 最 简单 方法 就 是 选择 其 他 方式 将 操作 符 重 载 定义 为 自由 函 
数 。 如 果 采 用 这 一 策略 ， 则 需要 在 point .h 接口 中 包含 如 下 函数 原型 : 


bool operator--(Point pl, Point p2); 


这 一 函数 原型 声明 了 一 个 自由 函数 ， 因 此 ， 它 必须 出 现在 Point 类 的 定义 之 外 。 其 对 应 的 
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实现 如 下 述 代码 所 示 ， 它 不 再 包含 Point:: 前 级 ， 因 为 该 函数 不 是 类 的 一 部 分 : 


bool operator==(Point pl, Point p2) { 

return pl.x == p2.x && pl.y == p2.y: 

) 

虽然 这 个 实现 由 于 它 同 等 地 处 理 了 形 参 pl 和 p2 而 更 易于 效仿 ， 但 这 段 代码 却 面临 着 
一 个 严重 的 问题 : 它 无 法 真正 运行 。 事 实 上 ， 如 果 在 Point 类 中 增加 这 段 定义 ， 代 码 将 不 
能 通过 编译 。 问 题 的 症结 在 于 == 操作 符 是 通过 自由 函数 的 方式 定义 的 ， 因 此 该 代码 并 不 能 
访问 类 中 的 私有 实例 变量 x 和 y. 

这 里 并 没有 添加 一 个 错误 图 标 ， 因 为 == 操作 符 实现 代码 的 最 终 版 本 正 是 这 个 例子 中 所 
呈现 的 代码 。 幸 运 的 是 ，C++ 语 言 提供 了 另外 一 种 用 于 解决 访问 权限 问题 的 方法 。 由 于 == 
操作 符 出 现在 point.h 接口 中 ， 它 概念 上 与 Point 类 相关 联 ， 因 此 在 某 种 程度 上 被 当成 
接收 者 而 拥有 访问 类 中 私有 变量 的 权限 。 

为 了 使 这 种 设计 可 行 ，Point 类 必须 让 C++ 编译 器 知道 : 对 于 一 个 特定 的 函数 ，== 
作 符 重 载 版 本 可 适当 地 允许 访问 类 中 的 私有 实例 变量 。 为 了 使 这 种 访问 合法 ，Point 类 必 
须 将 operator== 函数 定义 为 友 元 (friend) 函数 。 此 时 ， 友 元 的 特性 与 在 社交 网 络 中 的 友 
情 特 性 是 类 似 的 。 其 私有 信息 一 般 都 不 会 在 社会 中 大 范围 地 共享 ， 而 只 会 对 你 所 认可 的 朋友 
开放 。 

在 C++ 中， 将 自由 函数 声明 为 友 元 函数 的 语法 如 下 : 


friend prototype ; 


Hh, prototype 就 是 函数 原型 。 在 这 个 例子 中 ， 通 过 书写 如 下 语句 将 operator-- RS 
WA Point 类 的 友 元 函数 : 


friend bool operator--(Point pl, Point p2); 


这 行 语句 是 类 定义 的 一 部 分 ， 因 此 也 必须 是 point.h 接口 的 一 部 分 。 
在 C++ 中 ， 一 个 类 可 以 用 以 下 声明 使 其 成 为 另 一 个 类 的 友 元 ， 从 而 访问 该 类 的 私有 
信息 : 


friend class name; 


其 中 ，name 是 类 名 。 在 C++ 中 ， 这 种 关于 友 元 的 声明 并 非 自 动 是 双向 的 。 如 果 两 个 类 都 需 
要 获取 对 方 私有 变量 的 访问 权限 ， 则 这 两 个 类 都 必须 显 式 地 将 另 一 个 类 声明 为 其 友 元 类 。 

每 当 为 一 个 类 重 载 操 作 符 == 时 ， 最 好 的 做 法 是 同时 为 该 类 提供 != 重 载 操作 符 。 毕 
竟 用 户 希 望 判 断 两 个 点 是 否 不 同 与 判断 这 两 个 点 是 否 相 同 同样 容易 。C++ 并 未 默认 == 操 
作 符 和 | = 操作 符 运 算 返 回 相 反 的 结果 ; 如 果 你 想 要 得 到 这 种 相反 的 结果 ， 你 必须 单独 重 
载 这 两 个 操作 符 。 但 是 ， 在 实现 operator!= 时 ， 可 以 利用 operator== 的 实现 ， 因 为 
operator-- 是 类 的 一 个 公有 方法 。 因 此 ， 最 直截了当 地 重 载 ! = 操作 符 的 函数 看 起 来 如 以 
下 代码 所 示 : 

bool operator!=(Point pl, Point p2) { 


return !(pl == p2); 
) 


Point 类 的 最 终 版 本 在 下 几 页 中 给 出 。 图 6-4 包含 了 point.h 接口 ,图 6-5 包含 了 对 
MHJ point. cpp 的 实现 。 


188 


File: point.h 


This interface exports the Point class, which represents a point on 
a two-dimensional integer grid. 


* 


#ifndef point h 
define point h 


include <iostream> 
#include <string> 


class Point ( 
public: 
/* 
Constructor: Point 


Usage: Point origin; 
Point ptí(xc, yc); 


* Creates a Point object. The default constructor sets the coordinates 
* to 0; the second form sets the coordinates to xc and yc. 


Point(); 
Point(int xc, int yc); 


Methods: getX, getY 
Usage: int x - pt.getX(); 
int y = pt.getY(); 


These methods return the x and y coordinates of the point. 
i 

int getX(); 

int getY(); 


* Method: toString 
Usage: string str - pt.toString(); 


Returns a string representation of the Point in the form "(x,y)". 


ef 
std::string toString(); 


/* Private section */ 
private: 


/* Friend declaration */ 


friend bool operator==(Point pl, Point p2); 


Instance variables */ 


int x; /* The x-coordinate */ 
int y; /* The y-coordinate */ 


Operator: << 
Usage: cout << pt; 


Overloads the << operator so that it is able to display Point values. 


std::ostream & operator<<(std::ostream & os, Point pt); 


/* 


* Operator: 
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* Implements the == operator for points. 


*/ 


bool operator==(Point pl, Point p2); 


* Implements the != operator for points. It is good practice to 
overload this operator whenever you overload == to ensure that 
clients can perform either test. 


bool operator!z(Point pl, Point p2); 





#endif l 
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File: point .cpp 


This file implements the point.h interface. The comments have been 
eliminated from this listing so that the implementation fits on a 
single page. 


#include <string> 
#include "point .h" 
#include "strlib.h" 
using namespace std; 


Point: :Point() { 
x = 0; 
y = 
} 
Point: :Point (int xc, int yc) { 
x = xc; 
y = sc; 
} 
int Point::getX() ( 
return x; 


) 


int Point::getY() { 
return y; 


} 


string Point::toString() ( 
return "(" + integerToString(x) + "," + integerToString(y) * ")"; 
) 


bool operator==(Point pl, Point p2) { 
return pl.x == p2.x && pl.y == p2.y; 
) 


bool operator!-(Point pl, Point p2) ( 
return !(pl == p2); 
) 


ostream & operator<<(ostream & os, Point pt) ( 
return os «« pt.toString(); 


) 
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6.2.3 为 Direction 类 型 增加 操作 符 


虽然 在 类 定义 中 操作 符 重 载 比 较 常见 ,但 是 C++ 也 允许 你 扩展 操作 符 定义 ， 使 得 该 操 
作 符 可 以 应 用 到 枚 举 类 型 。 这 一 特性 允许 我 们 给 第 2 章 介 绍 的 direction.h 接口 中 添加 
两 个 操作 符 ， 它 使 得 Direction 枚 举 类 型 更 易于 使 用 。 
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5A Point 类 重 载 << 操作 符 的 原因 完全 相同 ， 为 Director 类 型 重 载 << 操作 符 将 
使 该 类 型 更 为 有 用 。 如 果 direction.h 接口 提供 了 directionToString MAM, 我们 可 
以 直接 实现 operator<< 函数 的 扩展 版 本 : 


ostream & operator««(ostream & os, Direction dir) ( 
return os << directionToString (dir); 
) 


与 类 库 接口 中 的 其 他 函数 类 似 ， 该 函数 体 存 在 于 direction.cpp XF, m E K AKUR 
型 则 必须 出 现在 direction.h 文件 中 。 

在 介绍 下 一 个 更 重要 和 更 精妙 的 操作 符 之 前 ， 必 须 认 识 到 Direction 类 型 提供 的 功能 
是 受 限制 的 。 正 如 将 在 第 9 章 中 所 看 到 的 ， 迭 代 Direction 类 型 中 的 元 素 是 非常 有 用 的 ， 
即 依 次 循环 地 在 NORTH, EAST, SOUTH 和 WEST 这 四 个 值 中 进行 迭代 。 为 此 ， 所 要 做 的 就 
是 像 下 面 这 样 毫 不 犹 移 地 使 用 for 循环 : 


for (Direction dir = NORTH; dir <= WEST; dir++) ... 


遗憾 的 是 ， 该 语句 不 适用 于 当前 定义 的 Direction 类 型 的 数据 。 问 题 的 关键 在 于 ++ 操作 
符 不 能 操作 枚 举 类 型 。 为 了 使 dir++ 这 一 语句 可 以 运行 ， 必 须 如 下 所 示 编 写 一 个 并 不 优雅 
的 表达 式 : 


dir = Direction(dir + 1) 


再 一 次 ， 操 作 符 重 载 有 助 于 解决 问题 。 为 了 使 标准 for 循环 可 以 像 往常 一 样 精 准 运行 ， 
必须 为 Direction 类 型 重 载 ++ 操作 符 。 然 而 ， 做 这 件 事 并 不 简单 。 在 C++ 中 ，++ 和 -- 
操作 符 是 特殊 的 ， 因 为 它们 彼此 都 分 别 有 前 组 和 后 缀 两 种 形式 。 当 它们 在 表达 式 中 作 前 级 
操作 符 时 ， 如 在 表达 式 ++x 中 ， 操 作 符 先 运算 ， 表 达 式 的 最 终结 果 是 运算 完成 后 的 变量 值 。 
当 它们 作为 后 缀 操作 符 时 ， 如 在 表达 式 x++ 中 ， 变 量 的 值 将 会 发 生 同样 的 改变 , 但 是 该 表 
达 式 的 值 是 变量 参加 ++ 运算 之 前 的 值 。 

当 用 C++ ERR ++ 或 -- 操作 符 时 ， 必 须 告诉 编译 器 你 想 要 重 载 的 操作 符 是 前 缀 形式 还 是 后 
WER CH 的 设计 者 选择 了 通过 传人 一 个 无 意义 的 整 型 参数 的 方式 来 说 明 其 操作 符 为 后 缀 形 
式 ， 用 以 区 别 其 前 缀 形式 。 因 此 ， 为 了 重 载 Direction 类 型 的 前 缀 ++ 操作 符 ， 定 义 如 下 函数 : 


Direction operator++(Direction & dir) { 
dir = Direction(dir + 1); 
return dir; 


) 
为 了 重 载 其 后 缀 操作 符 ， 应 如 下 所 示 定 义 函 数 : 


Direction operator++(Direction & dir, int) { 
Direction old = dir; 
dir = Direction(dir + 1); 
return old; 
} 
HER, dir 参数 必须 以 引用 方式 进行 传递 ， 以 保证 函数 可 以 改变 其 变量 值 。 这 个 例子 也 说 明 
f: 在 C++ 中 ， 如 果 不 需 要 使 用 形 参 值 ， 则 可 以 不 用 此 形 参 名 。 
若 重 载 这 一 操作 符 的 目的 只 是 保证 标准 for 循环 语句 的 正常 运行 ， 那么 类 库 版 本 的 
Direction 类 型 只 重 载 了 操作 符 的 后 缀 形式 。 这 种 扩展 对 于 那些 需要 进行 元 素 迭 代 的 枚 举 
类 型 具有 重要 意义 。 
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一 旦 你 完成 了 本 节 所 介绍 的 ++ 操作 符 的 重 载 之 后 ，Direction 类 型 将 变 得 更 易于 使 
用 。 例 如 ， 如 果 执 行 以 下 语句 : 


for (Direction dir = NORTH; dir <= WEST; dir++) 
cout << dir << endl; 
} 


会 得 到 如 下 输出 : 





6.3 有理 数 


”虽然 6.1 节 定 义 的 Point 类 表明 了 定义 一 个 新 类 的 基本 方法 ， 但 是 要 对 这 一 章 的 主 
题 形 成 一 个 牢固 的 认识 体系 却 需要 我 们 接触 更 多 更 复杂 的 例子 。 本 节 以 有 理 数 (rational 
number) 类 为 例 来 让 你 更 深入 地 了 解 类 的 设计 。 其 中 ， 有 理 数 是 指 所 有 可 以 用 两 个 整数 的 商 
来 表示 的 数 。 在 中 学 阶段 ， 你 们 可 能 将 这 类 数 称 为 分 数 (fraction)。 

在 某 些 方面 ， 有 理 数 与 你 在 第 1 章 中 使 用 的 浮 点 数 类 似 。 这 两 种 类 型 的 数 都 可 以 用 来 表 
示 分 数值 ， 例 如 1.5 就 是 有 理 数 3/2。 它 们 的 不 同 之 处 在 于 有 理 数 是 精确 的 ， 而 浮 点 数 却 因 
为 受 限 于 硬件 的 精度 只 能 是 近似 值 。 
为 了 更 好 地 理解 两 者 差别 的 重要 性 ， 考 虑 求 下 述 分 数 之 和 这 样 一 个 数学 问题 : 
Ped 
基本 算术 (甚至 是 直觉 ) 都 清晰 地 告诉 我 们 算术 精确 结果 为 1， 但 如 果 你 使 用 double 类 型 
进行 计算 将 很 难得 到 这 一 结果 。 下 面 的 程序 通过 使 用 双 精 度 浮 点 数 来 计算 其 和 并 显示 16 位 
精度 的 计算 结果 来 说 明 这 一 问题 : 
int main() { 
double a - 1.0 
double b = 1.0 
double c = 1.0 / 6.0; 
double sum = a + b + c; 
cout << setprecision (16) ; 
cout << "1/2 + 1/3 + 1/6 - " << sum << endl; 


return 0; 


) 
如 果 运 行 该 程序 ， 会 得 到 以 下 结果 : 


SN 





度 。 在 双 精 度 算术 的 限制 下 ，1/2 加 上 1/3 再 加 上 1/6 的 和 更 接近 0.999 999 999 999 999 9, 
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而 不 是 1.0。 更 糟糕 的 是 ， 计 算 所 得 的 和 会 小 于 1， 并 且 会 在 测试 程序 中 如 实 输出 。 当 程序 
运行 结束 时 ， 表 达 式 sum<1 的 值 为 true， 而 sum--1 的 值 为 false。 这 个 结果 从 数学 角 
度 上 来 说 是 完全 错误 的 。 

与 此 相反 ， 有 理 数 计算 不 会 出 现 四 舍 五 人 错误 ， 因 为 计算 过 程 并 不 涉及 任何 取 近 似 值 的 
操作 。 此 外 ， 有 理 数 遵循 如 图 6-6 所 总 结 的 良好 定义 的 计算 规则 。 但 是 C++ 的 预定 义 类 型 
中 并 不 包括 有 理 数 。 如 果 你 想 在 C++ 中 使 用 有 理 数 ， 那 么 必须 定义 一 个 类 来 表示 有 理 数 。 


6.3.1 定义 新 类 的 机 制 


使 用 面向 对 象 语言 定义 新 类 是 你 必须 掌握 的 一 项 重要 技能 。 在 大 多 数 编程 中 ,设计 新 类 
既是 一 门 科学 更 是 一 门 艺 术 。 开 发 高 效 的 类 设计 需 拥 有 良好 的 美学 素养 ， 同 时 需要 考虑 将 类 
作为 工具 的 用 户 的 需求 和 期 望 。 理 论 与 实践 是 最 好 的 老师 ， 但 是 遵循 一 个 普遍 适用 的 设计 框 
架 可 以 对 你 设计 高 效 的 类 提供 帮助 。 

根据 我 个 人 的 编程 经 验 ， 我 发 现 遵循 按部就班 的 方法 常常 是 很 有 用 的 : 

1. 从 普遍 性 的 角度 出 发 ， 思 考 用 户 会 如 何 使 用 一 个 类 。 在 设计 过 程 的 最 开始 ， 你 就 必 
须 确 立 一 种 思想 : 类 库 是 为 了 满足 用 户 的 需求 而 不 是 为 了 方便 类 的 实现 者 。 从 专业 的 角度 上 
说 ， 保 证 新 设计 的 类 更 好 迎合 用 户 需求 的 最 佳 方法 就 是 让 用 户 参 与 到 设计 过 程 中 。 不 管 怎 
样 ， 你 至 少 应 该 站 在 用 户 的 角度 来 描绘 类 的 设计 蓝图 。 





图 6-6 有 理 数 的 算术 运算 法 则 


2. 确定 什么 信息 属于 类 的 每 个 对 象 的 私有 部 分 。 虽 然 类 中 的 私有 部 分 从 概念 上 说 是 类 实 
现 的 一 部 分 , 但 是 对 于 该 类 的 对 象 必须 包括 哪些 信息 有 一 个 初步 的 了 解 可 以 简化 接 下 来 的 类 
设计 阶段 。 许 多 情况 下 ， 你 可 以 写 下 将 要 放置 在 私有 部 分 的 实例 变量 。 虽 然 在 这 个 阶段 并 不 
需要 做 到 如 此 清晰 的 划分 但 是 对 于 类 的 内 部 结构 有 一 个 清晰 的 印象 可 以 使 得 构造 函数 和 方 
法 的 定义 变 得 更 加 简单 。 

3. 定义 一 组 重 载 的 构造 函数 以 创建 新 的 类 对 象 。 因 为 类 通常 会 定义 多 个 重 载 形式 的 构造 
函数 ， 所 以 站 在 用 户 的 角度 考虑 用 户 需要 创建 的 对 象 类 型 及 在 创建 对 象 时 将 会 传人 的 信息 将 
会 非常 有 用 。 典 型 地 ， 每 个 类 都 会 提供 一 个 默认 构造 函数 ， 该 函数 允许 用 户 声明 该 类 对 象 并 
在 之 后 对 其 进行 初始 化 。 在 这 个 阶段 ， 还 必须 思考 构造 函数 是 否 需要 设置 约束 条 件 来 确保 最 
终生 成 对 象 的 合法 性 。 

4. 列 举 出 将 成 为 类 的 公有 方法 的 所 有 操作 。 这 一 阶段 的 目标 是 为 类 中 提供 的 方法 编写 
其 原型 ， 从 而 将 你 刚 开 始 时 开发 的 类 框架 转化 成 详细 说 明 。 也 可 以 在 这 个 阶段 中 细 化 整体 设 
计 ， 它 遵循 第 2 章 提 出 的 准则 : 统一 性 、 简 单 性 、 充 分 性 、 通 用 性 和 稳定 性 。 

5. 编码 并 测试 其 实现 。 一 旦 完成 了 类 的 接口 设计 ， 就 需要 编写 代码 来 实现 该 类 。 编 写实 现 
过 程 不 仅 是 为 了 得 到 一 个 可 以 运行 的 程序 ， 还 要 为 设计 提供 验证 。 在 编写 实现 代码 时 ， 你 还 需 
要 不 时 回顾 其 接口 设计 ， 例 如 ， 当 你 发 现 很 难 将 设计 中 一 种 特性 的 性 能 控制 在 一 个 预定 的 水 平 
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时 。 作 为 一 个 实现 者 ， 你 也 有 责任 测试 你 的 实现 代码 以 确保 类 提供 了 接口 中 计划 实现 的 功能 。 
接 下 来 的 各 节 将 遵循 上 述 步 骤 来 设计 Rational 类 。 


6.3.2 采用 用 户 的 观点 


设计 Rational 类 的 第 一 步 ， 你 需要 考虑 用 户 可 能 期 望 得 到 的 类 特性 。 在 一 个 大 公司 
里 ， 你 可 能 拥有 多 个 实现 小 组 ， 他 们 都 需要 使 用 有 理 数 ， 并 且 都 可 能 向 你 提供 他 们 对 于 这 个 
类 的 期 望 。 在 这 种 情况 下 ， 让 这 些 用 户 参 与 到 类 的 设计 中 ， 并 且 共 同 制定 设计 目标 将 是 非常 
有 帮助 的 。 

然而 ， 由 于 这 个 例子 是 基于 教科 书 的 背景 设计 的 ， 因 此 ， 你 不 可 能 组 织 与 预期 用 户 之 间 
的 会 议 。 这 个 例子 的 最 主要 目的 是 说 明 在 C++ 中 类 定义 的 结构 。 鉴 于 上 述 约 束 ， 以 及 需要 
控制 管理 该 实例 的 复杂 性 ， 因 此 ， 可 以 对 Rational 类 的 设计 目标 加 以 限定 ， 使 得 该 类 只 
实现 图 6-6 中 所 示 的 算术 操作 。 


6.3.3 确定 Rational 类 的 私有 实例 变量 


对 于 Rational 类 而 言 ， 其 私有 部 分 易于 说 明 。 一 个 有 理 数 被 定义 成 两 个 整数 的 商 。 
因此 ， 每 个 有 理 数 对 象 都 必须 始终 保持 对 这 两 个 整数 值 的 追踪 。 所 以 类 中 私有 部 分 中 声明 的 
实例 变量 如 下 : 

int num; 

int den; 


这 些 变量 名 是 数学 术语 分 子 (numerator) 和 分 母 (denominator) 的 简称 ， 这 两 个 术语 分 别 代 
表 了 分 数 的 上 半 部 分 和 下 半 部 分 。 

有 趣 的 是 ， 我 们 会 发 现 Point 类 和 Rational 类 的 实例 变量 只 是 名 称 不 同 ， 其 他 特性 
均 相 同 。 这 两 个 类 所 维护 的 值 都 由 一 对 整数 构成 。 这 两 个 类 所 不 同 的 是 这 些 整 数 所 代表 的 实 
际 含义 不 同 ， 这 也 反映 在 每 个 类 所 支持 的 操作 中 。 


6.3.4 为 Rational 类 定义 构造 函数 


给 定 代表 两 个 整数 商 的 一 个 有 理 数 ， 则 其 中 一 个 Rational 类 的 构造 函数 将 会 获取 代 
表 一 个 有 理 数 的 两 个 整数 。 例 如 ， 有 这 样 一 个 构造 函数 ， 可 以 通过 调用 Rational (1,3) 
来 定义 有 理 数 1/3。 这 种 构造 函数 的 原型 是 类 接口 的 一 部 分 ， 其 原型 为 : 


Rational(int x, int y); 


虽然 在 这 一 阶段 没有 必要 考虑 其 实现 细节 ， 但 是 在 脑海 中 保留 实现 过 程 的 初步 印象 可 以 使 
得 你 接 下 来 的 工作 更 加 轻松 。 在 这 一 阶段 ， 必 须 意 识 到 像 下 面 这 样 实现 构造 函数 是 不 合适 的 : 


Rational(int x, int y) ( 
adem LA 
这 个 实现 的 问题 是 该 构造 函数 没有 考虑 到 算术 法 则 对 于 分 子 和 分 母 数值 形式 的 约束 ， 这 一 约 
束 必须 体现 在 构造 函数 中 。 其 中 最 明显 的 约束 条 件 就 是 分 母 的 值 不 能 为 零 。 构 造 函 数 必须 检 


查 这 一 情况 ,并且 在 这 种 情况 可 能 发 生 时 抛 出 错误 提示 。 除 此 之 外 ， 还 存在 其 他 更 加 细微 的 
约束 条 件 。 如 果 用 户 传人 了 不 符合 规格 的 分 子 和 分 母 值 ， 那 么 同一 个 有 理 数 可 能 会 有 很 多 种 
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不 同 的 表现 方式 。 例 如 ， 有 理 数 1/3 可 以 写成 以 下 几 种 分 数 形式 : 


以 上 所 给 出 的 这 些 分 数 都 表示 同一 个 有 理 数 ， 因 此 ， 在 一 个 Rational 对 象 中 允许 任意 的 
分 子 、 分 母 值 组 合 是 不 优雅 的 。 如 果 每 一 个 有 理 数 都 有 一 个 一 致 、 唯 一 的 表示 ， 将 简化 其 实 
现 过 程 。 
在 数学 上 ， 通 过 遵循 以 下 规则 来 达到 上 述 目 标 : 
e 分 数 始终 以 最 简 项 来 表示 ， 这 意味 着 分 子 、 分 母 的 所 有 公 因 子 都 必须 约 掉 。 事 实 上 ， 
对 分 数 进行 化 简 的 最 简单 方法 是 将 分 子 和 分 母 除 以 它们 的 最 大 公约 数 ， 而 最 大 公约 
数 的 计算 可 以 使 用 2.1 节 介 绍 的 gcd 函数 。 
e 分 母 总 是 正 数 ， 这 也 意味 着 有 理 数值 的 符号 存储 在 分 子 中 。 
e 有 理 数 0 通常 用 0/1 表示 。 
可 以 采用 下 面 的 代码 实现 构造 郴 数 : 
Rational(int x, int y) { 
if (y == 0) error("Rational: Division by zero"); 
if (x == 0) { 
num = 0; 
den = 1; 
} else { 
int g = gcd(abs(x), abs(y)); 
num = x / g; 
den = abs(y) / g; 
if (y < 0) num = -num; 
) 
) 


作为 一 个 通用 规则 ， 每 一 个 类 都 应 该 拥有 一 个 默认 的 构造 函数 ， 在 声明 该 类 型 对 象 时 无 
须 传 入 任何 参数 的 情况 下 使 用 它 。 默 认 有 理 数 最 理想 的 值 是 零 ， 该 值 表示 为 01。 因 此 ,其 
默认 构造 函数 的 实现 代码 如 下 : | 


Rational() ( 
num = 0; 
den = 1; 

) 


最 后 ， 定 义 第 三 个 版 本 的 构造 函数 是 非常 有 用 的 ， 它 允许 用 户 创建 整数 Rational 对 
象 ， 此 时 ， 分 母 始终 为 1: 


Rational(int n) ( 


6.35 为 Rational 类 定义 方法 


之 前 提 到 限制 Rational 类 的 功能 是 为 了 实现 其 最 基本 的 算术 操作 ， 因 此 ， 特 别 是 
在 C++ 中 ， 和 弄 清楚 该 类 提供 的 方法 相对 比较 简单 。 包 括 Java 语言 在 内 的 许多 面向 对 象 编 
程 语言 只 能 通过 方法 来 定义 算术 操作 ， 比 如 定义 函数 add、subtract、multiply 和 
divide 来 实现 四 则 算术 运算 。 更 糟糕 的 是 ， 你 必须 使 用 接收 者 所 提供 的 语法 来 调用 这 些 


A áj žit 195 


函数 。 而 不 是 编写 如 下 直观 上 令 人 满意 的 声明 : 
Rational sum = a + b + c; 

像 Java 语言 会 要 求 你 编写 成 如 下 形式 : 
Rational sum = a.add(b) .add(c) ; 


尽管 不 难 理解 该 表达 式 的 含义 ， 但 是 这 种 方式 在 重新 定义 默认 提供 的 操作 符 方 面 缺 少 灵活 
性 和 表现 力 。 

对 此 ，C++ 有 更 好 的 语言 机 制 。C++ 允许 通过 重 载 操作 符 +、-、* 和 /来 实现 针对 
Rational 对 象 的 有 理 数 算术 运算 。 与 6.2 节 的 Point 类 一 样 ， 将 这 些 操 作 符 重 载 函 数 定 
义 成 自由 函数 而 不 是 类 的 方法 将 更 加 方便 ， 这 也 意味 着 这 四 个 操作 符 的 函数 原型 如 下 所 示 : 

Rational operator+(Rational rl, Rational r2); 

Rational operator- (Rational rl, Rational r2); 


Rational operator*(Rational rl, Rational r2); 
Rational operator/(Rational rl, Rational r2); 


类 似 于 Point 类 中 的 == 操作 符 ， 上 述 算术 操作 符 需 要 访问 Rational 类 对 象 上 1 r2 
的 域 ， 这 意味 着 这 些 操 作 符 重 载 函 数 必须 声明 为 Rational 类 的 友 元 函数 。 
虽然 Rational 类 的 专业 实现 还 必须 包括 很 多 其 他 有 用 的 方法 和 操作 ， 但 是 在 本 例 中 
我 们 想 要 增加 的 只 有 tostring 方法 和 一 个 重 载 的 << 操作 符 ， 而 添加 这 些 方法 是 让 你 养 
成 以 后 在 设计 类 时 自觉 实现 这 些 机 制 的 习惯 。 让 一 个 类 可 以 将 其 对 象 所 包含 的 值 以 用 户 可 
读 的 方式 显示 出 来 与 程序 测试 和 编译 是 同等 重要 的 ， 而 后 者 是 程序 开发 过 程 的 重要 阶段 。 
这 些 设计 决策 可 使 我 们 顺利 地 完成 rational.h 接口 的 定义 ， 其 详细 代码 如 图 6-7 所 示 。 


/* 
* File: rational h 
* 


* This interface exports a class for representing rational numbers. 
*/ 

#ifndef rational h 

#define rational h 


#include <string> 
#include <iostream> 
/* 
* Class: Rational 
* 


* The Rational class is used to represent rational numbers, which 
* are defined to be the quotient of two integers. 
* 


/ 
class Rational ( 
public: 
/* 
* Constructor: Rational 
* Usage: Rational zero; 


Rational num(n) ; 
Rational r(x, y); 


* Creates a Rational object. The default constructor creates the 

* rational number 0. The single-argument form creates a rational 
number equal to the specified integer, and the two-argument form 
creates a rational number corresponding to the fraction x/y. 


Rational (); 





6-7 Rational 类 的 接口 
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Rational (int n); 
Rational(int x, int y); 


/* 
* Method: toString() 
string str r.toString(); 


* Returns the string representation of this rational number. 


ali 
std::string toString (); 
Declare the operator functions as friends */ 


friend Rational operator+ (Rational rl, Rational r2); 
friend Rational operator-(Rational rl, Rational r2); 
friend Rational operator*(Rational rl, Rational r2); 
friend Rational operator/(Rational rl, Rational r2); 


/* Private section */ 
private: 
/* Instance variables */ 


int num; /* The numerator of this Rational object */ 
int den; /* The denominator of this Rational object */ 


Overloads the «« operator so that it is able to display Rational values 


std::ostream & operator««(std::ostream & os, Rational rat); 


/* 
Operator: + 
Usage: rl * r2 


Overloads the + operator so that it can add rational numbers. 
Sy 
Rational operator+(Rational r1, Rational r2); 
/* 
Operator: 一 
Usage: rl - r2 


Overloads the - operator so that it can subtract rational numbers. 
ay 


Rational operator- (Rational rl, Rational r2); 
Operator: * 
Usage: rl * r2 


Overloads the * operator so that it can multiply rational numbers. 


Sf 


Rational operator* (Rational r1, Rational r2); 


/* 
Operator: / 
Usage: rl / r2 


so that it can divide rational numbers. 


Rational operator/(Rational rl, Rational r2); 
#endif 





图 6-7 (48) 


6.3.6 SH Rational 类 
56 Rational 类 的 最 后 一 步 是 编写 图 6-8 所 示 的 代码 。 其 中 唯一 的 复杂 部 分 就 是 类 
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构造 函数 的 实现 ， 它 的 核心 代码 你 已 经 看 过 了 ， 因 此 *ational.cpp 的 内 容 已 相当 直观 。 
特别 是 当 你 将 操作 符 重 载 函 数 以 自由 函数 的 形式 实现 时 ， 你 会 发 现 其 实现 过 程 将 直接 遵 
循 图 6-6 所 示 的 数学 定义 。 例 如 ，operatort+ 函数 的 实现 过 程 如 下 : 


Rational operator+(Rational rl, Rational r2) { 
return Rational(rl.num * r2.den + r2.num * rl.den, 
rl.den * r2.den); 


) 
它 是 对 以 下 有 理 数 rl 和 2 加 法 运算 法 则 的 直接 翻译 : 


rl,,,r2,,, + r2 rl 


num den 


rl + r2 = 
Xlden Eden 


Rational 类 的 实现 还 包括 一 个 名 为 gcd 的 私有 方法 ， 它 实现 了 求 最 大 公约 数 的 欧 几 
里 得 算法 ， 这 个 方法 在 2.1 节 已 进行 了 介绍 ， 其 实现 在 rational.cpp 文件 中 。 然 而 ， 私 
有 方法 的 原型 必须 放置 在 类 的 私有 部 分 中 。 因 此 ， 即 使 用 户 不 必 调 用 这 一 方法 ， 其 方法 原型 
也 必须 是 rational.h 文件 中 的 一 部 分 。 如 果 你 仅 以 用 户 的 身份 来 使 用 该 类 ， 即 使 C++ 要 
求 类 的 私有 部 分 必须 包含 在 类 定义 中 ， 你 也 必须 忽略 类 中 的 私有 部 分 。 


* File: rational.cpp 


* This file implements the Rational class. 
* 
/ 


#include <string> 
#include <cstdlib> 
#include “error.h" 
#include "rational.h" 
#include "strlib.h" 
using namespace std; 


/* Function pretotypes */ 


int gcd(int x, int y); 


t Implementation notes: Constructors 


There are three constructors for the Rational class. The default 
constructor creates a Rational with a zero value, the one-argument 
form converts an integer to a Rational, and the two-argument form 
allows you to specify a fraction. The constructors ensure that 

* the following invariants are maintained: 


. The fraction is always reduced to lowest terms. 
The denominator is always positive. 
Zero is always represented as 0/1. 


my 


Rational: :Rational() { 
num = 0; 
den = 1; 

) 


Rational::Rational(int n) ( 
num - n; 
den = 1; 

) 


Rational::Rational(int x, int y) ( 
if (y == 0) error("Rational: Division by zero"); 
if (x == 0) ( 
num = 0; 
den = 1; 





图 6-8 Rational 类 的 实现 
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} else { 
int g = gcd(abs(x), abs(y)); 
num = x / g; 
den = abs(y) / g; 
if (y < 0) num = -num; 
} 
) 


/* Implementation of toString and the «« operator */ 


string Rational::toString() ( 
if (den -- 1) ( 
return integerToString (num); 
) else { 
return integerToString(num) + "/" + integerToString (den); 
) 
) 


ostream & operator««(ostream & os, Rational rat) { 
return os «« rat.toString(); 


) 


j* 
* Implementation notes: arithmetic operators 


* The implementation of the operators follows directly from the definitions. 
wy 


Rational operator+(Rational rl, Rational r2) | 
return Rational(rl.num * r2.den * r2.num * rl.den, rl.den * r2.den); 


) 


Rational operator- (Rational rl, Rational r2) { 
return Rational(rl.num * r2.den - r2.num * rl.den, rl.den * r2.den); 


) 


Rational operator*(Rational rl, Rational r2) { 
return Rational(rl.num * r2.num, rl.den * r2.den); 


) 


Rational operator/(Rational rl, Rational r2) ( 
return Rational(rl.num * r2.den, rl.den * r2.num); 


) 


This implementation uses Euclid's algorithm to calculate the 
greatest common divisor. 


"y 


int gcd(int x, int y) ( 
int r = x ¢ y; 
while (r != 0) { 
x= y; 
yteE; 
r=x ty; 


) 


return y; 





} 


图 6-8 ( 续 ) 


6.4 token 扫描 器 类 的 设计 


在 第 3 章 ， 字 符 串 处 理 过 程 中 最 复杂 的 例子 就 是 儿童 黑 话 翻译 器 。 如 图 3-2 所 示 ， 
PigLatin 程序 将 问题 分 解 成 两 个 部 分 : lineToPigLatin 函数 将 输入 划分 为 一 个 个 单 
词 ， 然 后 调用 wordToPigLatin 函数 将 每 个 单词 转换 为 儿童 黑 话 。 但 是 其 第 一 阶段 的 单 
词 分 解 在 儿童 黑 话 领域 显得 并 不 专业 。 许 多 应 用 需要 将 字符 串 分 解 成 单词 ， 更 常见 的 ， 将 
其 分 解 成 包含 多 于 一 个 字母 的 逻辑 单元 。 在 计算 机 科学 领域 中 ， 这 种 逻辑 单元 称 为 记号 
(token). 

由 于 将 字符 串 分 解 成 独立 的 记号 这 一 问题 在 各 种 应 用 中 普遍 采用 ， 因 此 为 这 一 目标 单独 
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建立 一 个 类 包 是 很 有 必要 的 。 本 节 将 介绍 一 个 用 来 完成 这 一 任务 的 TokenScanner 类 。 首 
要 任务 就 是 建立 一 个 使 用 简单 、 用 法 灵活 并 且 能 满足 多 种 用 户 需 求 的 类 包 。 


6.4.1 用户 想 从 记号 扫描 器 中 得 到 什么 


与 往常 一 样 ， 开 始 设计 TokenScanner 类 的 最 好 方法 就 是 站 在 用 户 的 角度 审视 问题 。 
想 使 用 扫描 器 的 每 个 用 户 都 从 一 个 记号 源 开 始 ， 它 们 可 能 是 一 个 字符 串 或 者 是 应 用 从 文件 中 
读 取 的 数据 输入 流 。 无 论 上 述 哪 种 情况 ， 用 户 所 需要 的 都 是 以 某 种 方法 从 这 个 记号 源 中 抽取 
出 一 个 个 特定 的 记号 。 

可 以 采用 多 种 机 制 设 计 TokenScanner 类 ， 使 其 能 提供 必需 的 功能 。 例 如 ， 可 以 让 记 
号 扫描 器 返回 一 个 夺 括 整个 记号 列表 的 矢量 。 但 是 ， 这 种 策略 并 不 适合 对 大 型 输入 文件 的 扫 
描 ， 因 为 在 这 种 情况 下 ， 扫描 器 必须 创建 一 个 单独 的 矢量 来 保存 整个 记号 列表 。 一 个 更 加 空 
间 有 效 的 方法 是 让 扫描 器 一 次 传送 一 个 记号 。 当 使 用 这 种 设计 时 ， 扫 描 器 读 取 记 号 过 程 的 伪 
码 形式 如 下 : 

Set the input for the token scanner to be some string or input stream. 

while (more tokens are available) { 


Read the next token. 
) 


这 段 伪 码 结构 直接 表明 了 TokenScanner 类 必须 支持 的 方法 。 从 这 个 例子 中 ， 可 能 希 
望 TokenScanner 类 提供 以 下 方法 : 

e 一 个 允许 用 户 指明 记号 来 源 的 setInpnut 方法 。 理 想 情况 下 ， 这 个 方法 应 该 重 载 ， 

使 得 输入 可 以 是 一 个 字符 串 或 者 是 一 个 输入 流 。 

e 一 个 用 于 判断 扫描 器 扫描 过 程 中 是 否 还 有 待 扫描 记号 的 hasMoreTokens 方法 。 

e 扫描 并 返回 下 一 个 记号 的 nextToken 方法 。 
上 述 这 些 方法 定义 了 记号 扫描 器 的 操作 结构 ， 并 且 它 在 很 大 程度 上 与 特定 的 应 用 独立 。 然 
而 ， 不 同 的 应 用 有 各 种 各 样 的 记号 ， 因 此 ，Tokenscannez 类 必须 向 用 户 提 供 控制 来 决定 
扫描 器 到 底 识别 的 是 哪 种 类 型 的 记号 。 

我 们 可 以 很 容易 地 通过 一 些 例子 来 说 明 用 户 期 望 识 别 不 同类 型 记号 的 需求 。 首 先 ， 回 顾 
一 下 将 英语 翻译 成 儿童 黑 话 的 问题 ， 这 对 我 们 目前 的 设计 极 具 启 发 性 。 如 果 你 使 用 记号 扫描 
器 来 重 写 PigLatin 程序 ， 那么 必须 牢记 在 这 一 阶段 不 能 忽略 空格 和 标点 符号 ， 因 为 这 些 
字符 将 成 为 输出 的 一 部 分 。 在 儿童 黑 话 问题 中 ， 记 号 会 以 下 述 两 种 形式 之 一 出 现 : 

1. 一 个 由 字母 和 数字 字符 组 成 用 来 表示 一 个 单词 的 连续 字符 串 。 

2. 一 个 包括 空格 或 标点 符号 在 内 的 单字 符 字 符 串 。 
如 果 你 给 记号 扫描 器 以 下 输入 : 

this is "pig latin" 
并 多 次 调用 nextToken， 则 会 返回 以 下 9 个 有 序 的 记号 : 
this] [ | [is] |] ["] [Pig] [| [Latin] ["] 
但 是 其 他 应 用 可 能 会 定义 不 同类 型 的 记号 。 例 如 ，C++ 编译 器 使 用 记号 扫描 器 将 程序 划 


分 为 许多 记号 ， 这 些 记号 包括 限定 符 、 常 量 、 操 作 符 和 其 他 定义 语法 结构 的 符号 。 例 如 ， 如 
果 你 向 编译 器 的 记号 扫 撒 器 输入 以 下 语句 : 
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cout << "hello, world" << endl; 
你 会 得 到 以 下 记号 序列 : 
[cout] [<<] ["hello, world"] [<<] [endl] [;] 


在 这 两 个 应 用 领域 中 ， 记 号 的 定义 略微 不 同 。 在 儿童 黑 话 转换 器 中 ， 所 有 非 字母 数字 的 
字符 序列 的 元 素 都 被 处 理 成 单字 符 记 号 返回 。 在 编译 器 的 例子 中 ， 情 况 变 得 更 加 复杂 。 因 为 
编程 语言 经 常 定 义 两 个 字符 组 成 的 操作 符 ， 如 << 操作 符 ， 这 些 操作 符 必 须 被 整体 地 当成 一 
个 记号 。 与 此 类 似 ， 字 符 串 常量 "hello, world!" 仅 当 它 被 记号 扫描 器 当成 一 个 单独 的 实 
体 才 具有 明确 的 意义 。 也 许 有 点 不 明显 ， 除 非 该 空格 出 现在 字符 串 常量 中 ， 否 则 编译 器 的 记 
号 扫描 器 忽略 输入 中 的 所 有 空格 。 

正如 你 将 在 编译 课 中 学 到 的 ， 创 建 一 个 允许 用 户 通 过 输入 精确 规则 定义 合法 输入 类 型 的 
记号 扫描 器 是 可 能 的 。 这 种 设计 提供 了 最 大 的 通用 性 。 但 是 ， 通 用 性 有 时 也 会 降低 程序 的 简 
洁 性 。 如 果 你 强迫 用 户 为 记号 信息 设置 规则 ， 将 导致 用 户 需 要 学 习 如 何 正 确 书写 规则 ， 这 在 
很 大 程度 上 与 学 习 一 种 新 语言 类 似 。 更 糟糕 的 是 ， 记 号 信息 规则 的 制定 对 于 用 户 来 说 是 复杂 
和 困难 的 ， 特 别 是 如 果 你 试图 定义 编译 器 识别 规则 的 数量 。 

如 果 你 设计 接口 的 目标 是 使 其 最 简化 ， 将 Tokenscanner 类 设计 成 允许 用 户 指 明 
期 望 在 应 用 中 得 到 的 记号 类 型 会 更 加 理想 。 如 果 你 只 需要 记号 扫描 器 搜集 组 成 单词 的 字 
母 数 字 序 列 串 信息 ， 可 以 只 使 用 TokenScanner 类 的 最 简单 的 配置 。 例 如 ， 如 果 你 想 要 
TokenScanner 类 识别 一 个 C++ 程序 ， 可 以 选择 性 地 设置 扫描 器 ， 使 得 扫描 器 忽略 空格 字 
符 ， 将 引号 包括 的 字符 串 划分 为 一 个 独立 单元 ， 并 且 将 特定 组 合 的 标点 符号 看 成 为 多 字符 的 
操作 符 。 


6.4.2 tokenscanner.h#0 


C++ Stanford 类 库 提 供 了 一 个 TokenScanner 类 ， 在 不 牺牲 其 简单 性 的 前 提 下 ， 该 类 
提供 了 很 大 的 灵活 性 。Tokenscanner 类 提供 的 方法 如 表 6-1 所 示 ， 其 中 接口 的 大 部 分 方 
法 提供 了 改变 扫描 器 默认 属性 的 选择 。 例 如 ， 你 可 以 通过 将 记号 扫描 器 初始 化 为 以 下 状态 使 
其 忽略 所 有 空格 字符 : 


TokenScanner scanner; 
scanner.ignoreWhitespace(); 


如 果 你 想 要 初始 化 Tokenscanner 类 使 之 遵循 C++ 语言 的 记号 规则 ， 你 可 以 采用 以 下 
代码 : 


TokenScanner scanner; 
scanCPlusPlusTokens (scanner): 


HP, scancPlusPlusToken 方法 的 定义 如 图 6-9 所 示 。 
表 6-1 类 库 TokenScanner 类 提供 的 方法 








构造 函数 







初始 化 一 个 扫描 器 对 象 。 记 号 源 来 自 特定 的 字符 串 或 者 是 一 个 输入 文件 。 如 果 不 提 
供 任何 记号 源 ， 用 户 必须 在 从 扫描 器 中 读 取 记号 之 前 调用 set Input 函数 


TokenScanner () 
TokenScanner (str) 
TokenScanner ( infile) 
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( 续 ) 





读 取 记号 方法 






hasMoreTokens () 


若 读 取 的 输入 源 中 还 有 剩余 的 记号 ， 则 返回 true 
返回 扫描 器 扫描 的 下 一 个 记号 。 如 果 在 没有 可 访问 记号 的 情况 下 调用 nextToken 
函数 ， 则 返回 一 个 空 字符 串 


将 特定 记号 存储 为 扫描 器 的 内 部 状态 ， 以 保证 在 调用 nextToken 函数 时 可 以 返 
回 该 标记 。 库 实现 允许 用 户 保存 任意 数量 的 标记 ， 这 些 标记 会 被 存储 在 一 个 类 似 
栈 的 存储 结构 中 









nextToken() 










saveToken (token) 


控制 扫描 规则 的 方法 
ignoreWhitespace() 将 扫描 器 设置 为 忽略 空格 字符 
ignoreComments () 将 扫描 器 设置 为 忽略 注释 。 这 些 注释 可 以 是 /* 或 者 是 // 类 型 的 注释 
— 将 扫描 器 设置 为 接受 合法 数字 并 将 其 整体 当成 一 个 记号 。 数 字 的 语法 与 C++ 
中 的 一 样 
将 扫描 器 设置 为 返回 一 个 将 双 引 号 括 起 来 的 字符 串 作为 一 个 独立 的 记号 。 引 号 
scanStrings () (可 能 是 单 引号 也 可 能 是 双 引 号 ) 被 包括 在 记号 中 ， 使 得 用 户 可 以 区 分 字符 串 类 
型 记号 和 其 他 类 型 的 记号 


addWordCharacters (sir) 将 str 变量 中 的 字符 添加 到 合法 的 单词 中 
定义 一 个 新 的 多 字符 操作 符 。 扫 描 器 将 返回 符合 定义 的 最 长 的 所 定义 的 操作 


em 符 ， 并 且 将 至 少 返回 一 个 字符 
其 他 方法 
setInput (str) 将 扫描 器 的 输入 源 设置 为 str 表示 的 字符 串 或 者 infile 表示 的 输入 流 。 扫 描 之 前 
setInput (infile) 输入 源 获得 的 记号 将 被 清空 
getPosition() 返回 扫描 器 在 当前 输入 字符 串 中 的 位 置 
isWordCharacter (cA) 如 果 字 符 ch 与 在 单词 中 存在 匹配 项 ， 则 返回 true 
verifyToken (expected) 读 取 下 一 个 记号 ， 并 检查 该 记号 与 字符 串 expected 是 否 匹 配 
getTokenType (token) 返回 记号 类 型 ， 包 括 : EOF, SEPARATOR, WORD, NUMBER, STRING, OPERATOR 


Function: scanCPlusPlusTokens 
Usage: scanCPlusPlusTokens (scanner) 


* Sets the necessary options for the scanner so that it can 
* read C++ source code. 


void scanCPlusPlusTokens(TokenScanner & scanner) { 
scanner.ignoreWhitespace(); 
scanner.ignoreComments (); 
scanner.scanNumbers(); 
scanner.scanStrings(); 


scanner.addWordCharacters(" "); 
scanner .addOperator ("++"); 
scanner. addOperator ("——") ; 
scanner. addOperator ("=="); 
scanner.addOperator ("!=") ; 
scanner. addOperator ("<=") ; 
scanner .addOperator (">=") 
scanner .addOperator ("<<") 
scanner .addOperator (">>"); 
scanner .addOperator ("G&"); 
scanner.addOperator ("||"); 
scanner .addOperator ("+="); 
scanner.addOperator("--"); 


图 6-9 初始 化 Tokenscanner 用 于 扫描 C++ 的 记号 
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scanner.addOperator("*-"); 
scanner.addOperator("$-"); 
scanner.addOperator ("^="); 

") 
) 


scanner.addOperator("&-"); 
scanner .addOperator ("|="); 


scanner .addOperator ("<<="); 
scanner .addOperator (">>="); 
scanner .addOperator ("->"); 
scanner .addOperator("::"); 





图 6-9 (£x) 


图 6-9 的 scancPlusPlusTokens 的 实现 向 编译 器 传递 以 下 信息 : 必须 忽略 空格 字符 
和 注释 ， 数 值 与 字符 串 必须 被 归 类 为 一 个 单一 标记 ， 下 划 线 在 标识 符 中 是 合法 的 ， 并 且 扫 描 
器 必须 检测 addOperator 方法 中 定义 的 多 字符 的 操作 符 (有 些 并 不 常用 ,但 在 C++ 中 有 
明确 定义 )。 
tokenscanner.h 接口 使 得 编写 各 种 应 用 变 得 更 为 简单 ， 这 些 应 用 包括 你 在 本 书 已 
看 到 过 的 。 例 如 ， 可 以 使 用 它 通 过 重 写 以 下 的 1ineToPigLatin 函数 来 简化 图 3-2 中 的 
PigLatin 程序 : 
string lineToPigLatin(string line) { 
TokenScanner scanner (line); 
string result = ""; 
while (scanner.hasMoreTokens()) { 
string word - scanner.nextToken(); 
if (isalpha(word[0])) word = wordToPigLatin (word); 
result += word; 
} 


return result; 


} 


新 版 本 的 LineToPigLatin 函数 相 比 老 版 本 显得 更 加 短小 精 悍 ， 从 概念 上 讲 它 已 经 进行 
了 真正 的 简化 。 老 版 本 代码 只 能 在 单个 字符 上 进行 操作 ， 而 新 版 本 可 以 在 整个 单词 上 进行 操 
作 ， 因 为 TokenScanner 类 已 实现 了 对 底层 细节 的 管理 。 


6.4.3 ”实现 TokenScanner 类 


特别 地 ， 在 给 定 该 类 所 支持 的 有 限 操作 之 后 ， 将 整个 Tokenscanner 类 的 完整 实现 作 
为 一 个 有 效 的 实例 将 太 复 杂 。 图 6-10 和 图 6-11 给 出 了 记号 扫描 器 包 的 简化 版 本 ,该 版 本 自 
定义 了 以 下 方法 : 

e. 一 个 传人 字符 串 参 数 的 构造 函数 ， 以 及 一 个 默认 构造 函数 。 
一 个 setInput 方法 ， 它 将 扫描 器 的 输入 定义 为 字符 串 。 
一 个 nextToken 方法 ， 它 返回 字符 串 中 的 下 一 个 记号 。 
一 个 hasMoreTokens 方法 ， 它 允许 用 户 查 看 是 否 有 剩余 记号 未 被 扫描 。 
一 个 ignoreWhitespace 方法 ， 它 将 扫描 器 设置 为 忽略 空格 字符 。 


/* 


* File: tokenscanner.h 
> 


* This file exports a simple TokenScanner class that divides a string 
* into individual logical units called tokens. 


+7 





图 6-10 简化 的 TokenScanner 类 的 接口 
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#ifndef tokenscanner h 
#define tokenscanner h 


#include <string> 


/* 


* 


*ox* * o 4 o * * ee * o * * * o» * * o* 


This class is used to represent a single instance of a scanner 
In this simplified version of the class, tokens come in two forms: 


1. Strings of consecutive letters and digits representing words 
2 One-character strings representing punctuation or separators 


The use of the TokenScanner class is illustrated by the following code 
pattern, which reads the tokens in the string variable input: 


TokenScanner scanner: 
scanner.setInput (input); 
while (scanner hasMoreTokens()) ( 
string token = scanner.nextTcken(); 
process the token 


} 


This version of the TokenScanner class includes the ignoreWhitespace 
method. The other options available in the library version of the 
class are included as exercises in the text. 

/ 


class TokenScanner { 


public: 


/* 
* 
* 


* 
* 
* 


Constructor: TokenScanner 
Usage: TokenScanner scanner; 
TokenScanner scanner (str); 


Initializes a scanner object The initial token stream comes from 
the string str, if it is specified. The default constructor creates 
a scanner with an empty token stream. i 


/ 


TokenScanner(); 
TokenScanner(std::string str); 


Method: setInput 


* Usage: scanner setInput (str); 


Sets the input for this scanner to the specified string Any 


* previous input string is discarded 


void setInput (std::string str); 


Method: hasMoreTokens 
Usage: if (scanner.hasMoreTokens()) 


Returns true if there are additional tokens for this scanner to read. 


ey 


bool hasMoreTokens(); 


Method: nextToken 
Usage: token = scanner. nextToken(); 


Returns the next token from this scanner If called when no tokens 
are available, nextToken returns the empty string. 


std::string nextToken(); 
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Method: ignoreWhitespace() 
Usage: scanner.ignoreWhitespace() ; 


t y FE 


Tells the scanner to ignore whitespace characters. By default, the 
nextToken method treats whitespace characters (typically spaces and 
tabs) just like any other punctuation mark and returns them as 
single-character tokens. Calling 


scanner.ignoreWhitespace(); 


changes this behavior so that the scanner ignores whitespace characters. 
/ 


*o*^" * » » * o * » * 


void ignoreWhitespace(); 
private: 
/* Instance variables */ 


std::string buffer; /* The input string containing the tokens */ 
int cp; /* The current position in the buffer */ 
bool ignoreWhitespaceFlag;  /* Flag set by a call to ignoreWhitespace */ 


Private methods */ 
void skipWhitespace(); 
}; 
#endif 





图 6-10 (48) 


File: tokenscanner.cpp 


* This file implements the TokenScanner class. Most of the methods 
* are straightforward enough to require no additional documentation. 
s/f 


#include <cctype> 
#include <string> 
#include "tokenscanner.h" 
using namespace std; 


TokenScanner::TokenScanner() ( 
/* Empty */ 
} 


TokenScanner: :TokenScanner(string str) { 
setInput (str) ; 
} 


void TokenScanner::setInput (string str) { 
buffer = str; 
cp = 0; 

) 


bool TokenScanner: :hasMoreTokens() { 
if (ignoreWhitespaceFlag) skipWhitespace() ; 
return cp < buffer.length() ; 


Implementation notes: nextToken 


This method starts by looking at the current character, which is 
indicated by the index cp. If the index is past the end of the string, 
nextToken returns the empty string. If the character is alphanumeric, 
nextToken scans ahead until it finds the end of a word; if not, 
nextToken returns the character as a one-character string 


ud 


string TokenScanner::nextToken() ( 
if (ignoreWhitespaceFlag) skipWhitespace(); 


图 6-11 简化 的 TokenScanner 类 的 实现 
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if (cp »- buffer.length()) ( 
return ""; 
) else if (isalnum(buffer[cp]l)) { 
int start - p 
while (cp < buffer. length() && er ini { 
cptt; 


) 

return buffer.substr(start, cp - start); 
} eise ( 

return string(l, buffer[cp**]); 
) 


iplesentatis not 


* The SO espace method simply sets 
F Pty 
* skipWhitespace ıs called only if that fla 


void TokenScanner::ignoreWhitespace() { 
ignoreWhitespaceFlag = true; 


) 


void TokenScanner::skipWhitespace() ( 
while (cp « buffer.length() && isspace(buffer[cp])) ( 
cpt*; 
) 
) 





图 6-11 (4) 


ignoreWhitespace 方法 被 设计 为 可 在 本 程序 包 内 得 到 为 其 他 选项 设置 的 模型 ， 你 可 以 
在 习题 中 自己 完善 所 有 这 些 设置 的 实现 。 但 是 ， 增 加 从 数据 文件 读 取 记号 的 功能 依赖 第 11 
章 中 引入 的 一 些 概念 ， 因 此 ， 你 必须 学 完 之 后 章节 的 内 容 才 能 完成 TokenScanner 类 的 
实现 。 


6.5 将 程序 封装 成 类 


你 在 本 章 所 看 到 的 大 多 数 的 类 定义 创建 了 一 种 新 的 抽象 类 型 ， 你 可 以 像 使 用 基本 类 型 变 
量 一 样 来 使 用 这 种 抽象 类 型 。 例 如 ， 一 旦 定义 了 Rational 类 ， 你 可 以 像 使 用 C++ 中 的 其 
他 基本 类 型 一 样 使 用 Rational 类 。 你 可 以 声明 Rational 类 型 的 变量 以 保存 其 值 ， 也 可 
对 这 些 变量 赋 以 新 值 ， 使 用 操作 符 组 合 这 些 变量 ， 在 cout 上 输出 这 些 变量 的 值 ， 并 且 可 将 
它们 存储 在 各 种 集合 类 对 象 中 。 使 用 了 有 理 数 类 的 程序 将 会 在 运行 时 创建 许多 Rational 
对 象 ， 所 有 这 些 对 象 都 是 同一 个 Rational 类 的 实例 。 

然而 ， 当 你 不 需要 为 一 个 特定 的 类 创建 一 个 以 上 的 对 象 时 ， 类 仍然 在 程序 中 扮演 着 重要 
作用 。 例 如 ， 以 类 来 组 织 程序 比 使 用 自由 函数 集合 来 构建 程序 更 加 有 效 。 这 样 做 的 最 大 优点 
就 是 类 提供 了 更 好 的 封装 性 。 这 种 封装 性 使 得 对 类 私有 实例 变量 的 访问 只 能 限制 于 类 内 ， 这 
意味 着 使 用 私有 实例 变量 要 比 使 用 全 局 变量 共享 信息 具有 更 高 的 安全 性 。 

作为 这 一 技术 的 说 明 ， 图 6-12 所 示 的 程序 向 我 们 展示 了 如 何 将 图 5-5 中 的 收银 台 
排队 模拟 程序 重新 设计 为 一 个 类 。 在 这 一 新 的 设计 中 ， 自 由 函数 runsimulation 和 
printReport 被 重新 设计 为 CheckoutLineSimulation 类 的 公有 方法 。 这 些 方法 的 实 
现 与 原 函 数 体 相同 ， 这 一 改变 仅 对 代码 的 复杂 性 产生 了 一 点 细微 的 影响 。 但 是 这 一 改变 的 好 
处 是 : 程序 运行 时 ， 方 法 之 间 的 共享 信息 现在 可 通过 实例 变量 来 存储 ， 而 无 需 通 过 参数 传 
递 。 类 中 的 所 有 方法 对 其 数据 访问 权 的 共享 大 幅度 降低 了 其 方法 参数 列表 的 规模 和 复杂 性 ， 
在 这 个 例子 中 ， 方 法 形 参 的 数量 从 三 个 缩减 至 零 。 
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File: CheckoutLineClass.cpp 


This program duplicates the CheckoutLine program from Chapter 5, 
but embeds the entire program in a class definition. 


#include <iostream> 
#include <iomanip> 
#include "queue.h" 
#include "random.h" 
using namespace std; 


/* Constants */ 


const double ARRIVAL PROBABILITY = 0.05; 
const int MIN SERVICE TIME - 5; 
const int MAX SERVICE TIME - 15; 
const int SIMULATION TIME - 2000; 


: CheckoutLineSimulation 


* This class encapsulates the code and data for the simulation 


*/ 
class CheckoutLineSimulation { 
public: 
void runSimulation() ( 


.. same as in Figure 5-5... 


void printReport() ( 
) ... sume as in Figure 5-5... 


private: 
int nServed; /* Number of customers served */ 
int totalWait; /* Sum of all customer waiting times */ 
int totalLength; /* Sum of the queue length at each time step */ 


}; 


/* Main program */ 


int main() ( 
CheckoutLineSimulation simulation; 
simulation.runSimulation(); 
simulation.printReport () ; 
return 0; 





图 6-12 ”基于 类 的 收银 台 排队 模拟 程序 版 本 


当 你 使 用 上 述 方法 实现 程序 时 ， 将 使 main 函数 变 得 更 加 简短 。main 函数 声明 了 一 个 
封装 了 程序 操作 过 程 的 类 对 象 ， 然 后 调用 其 公有 方法 来 运行 程序 ， 最 后 的 main 函数 定义 如 
图 6-12 所 示 : 


int main() { 
CheckoutLineSimulation simulation; 
simulation.runSimulation(); 
simulation.printReport(); 
return 0; 


} 


随 着 程序 复杂 性 的 增 大 ， 使 用 类 来 组 织 程序 的 优点 将 更 加 明显 。 本 书 只 在 使 用 这 一 技术 可 以 
简化 代码 的 情况 下 才 会 采用 这 一 设计 理念 。 
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本 章 小 结 
本 章 的 主要 目的 就 是 介绍 在 设计 和 实现 自 定义 类 型 时 需要 的 若干 工具 。 本 章 的 示例 重点 强 
调 了 类 将 数据 和 其 操作 封装 为 一 个 整体 的 特性 ， 我 们 将 在 第 19 章 介绍 更 加 复杂 的 类 继承 特性 。 
本 章 的 要 点 包括 : 


在 大 多 数 应 用 中 ， 将 许多 独立 数据 值 组 合成 一 个 单独 的 抽象 数据 类 型 是 很 有 用 的 。 
C++ 为 这 种 数据 封装 提供 了 多 种 机 制 。 在 最 底层 ，C++ 延续 了 对 C 语言 风格 数据 结 
构 定 义 的 支持 。 但 是 在 现代 编程 实践 中 ， 我 们 更 多 的 是 使 用 类 来 实现 数据 的 封装 。 
在 ;C++ 中 ， 一 个 类 被 划分 为 不 同 的 部 分 以 实现 用 户 对 该 部 分 数据 域 和 方法 的 访问 控 
制 。 类 的 公有 部 分 对 所 有 类 型 的 用 户 开 放 ; 类 的 私有 部 分 仅 对 其 实现 开放 。 在 现代 
面向 对 象 编程 风格 中 ， 实 例 变 量 被 声明 为 类 的 私有 部 分 。 一 个 类 可 以 通过 将 其 他 函 
数 和 类 声明 为 该 类 的 友 元 (friend) 来 赋予 它们 访问 类 中 私有 数据 的 权限 。 

给 定 一 个 要 么 是 一 个 类 要 么 是 一 个 结构 类 型 的 混合 对 象 ， 你 可 以 通过 使 用 点 操作 符 
来 选择 该 对 象 所 包含 的 独立 成 员 。 用 户 只 能 选择 该 对 象 中 声明 为 公有 部 分 的 数据 域 。 
但 是 ， 类 的 实现 代码 可 访问 该 类 所 有 对 象 的 私有 成 员 。 

典型 地 ， 类 的 定义 可 导出 一 个 或 多 个 负责 初始 化 该 类 对 象 的 构造 函数 。 通 常 ， 所 有 
的 类 定义 中 都 包含 一 个 不 接收 任何 参数 的 默认 构造 函数 。 

允许 用 户 访问 实例 变量 数值 的 方法 被 称 为 读 取 器 ; 允许 用 户 改 变 实 例 变 量 数值 的 方 
法 称 为 设置 器 。 拒 绝 用 户 在 创建 对 象 后 改变 对 象 数值 的 类 是 不 可 变 的 。 

典型 地 ， 类 的 定义 可 实现 其 接口 与 实现 的 分 离 。 其 中 ，.h 文件 只 包含 类 中 的 方法 
原型 ; 而 其 方法 体 包含 在 .cpp 文件 中 。 在 C++ 语言 中 ， 类 的 实现 细节 包含 在 文 
件 .cpp 中 ， 它 必须 通过 在 方法 名 前 增加 类 名 和 : : 标签 来 表明 该 方法 属于 哪个 类 。 
类 定义 中 可 以 通过 两 种 方式 来 重 载 基本 操作 符 。 将 一 个 操作 符 重 载 定 义 为 类 的 方法 
意味 着 该 操作 符 是 类 的 一 部 分 ， 因 此 可 以 自由 访问 类 中 的 私有 成 员 。 将 一 个 操作 符 
重 载 定 义 成 自由 函数 使 代码 变 得 简单 易 读 ， 但 也 意味 着 操作 符 函 数 必须 被 定义 成 类 
的 友 元 函数 ， 这 样 操作 符 才 能 访问 类 中 的 私有 成 员 。 

需要 重 载 的 一 个 最 有 用 的 操作 符 就 是 插 和 人 操作 符 <<， 因 为 这 样 做 可 以 很 容易 将 类 的 
值 显 示 在 控制 台 上 。 本 书 大 多 数 的 类 都 重 载 了 << 操作 符 ， 并 且 定 义 了 toString 
方法 ， 它 将 类 中 的 数值 转换 为 对 应 的 字符 串 。 

设计 一 个 新 类 既是 一 门 科 学 也 是 一 种 艺术 。 尽 管 本 章 提供 了 设计 类 的 一 些 通用 的 指 
南 ， 但 是 必须 牢记 实践 和 练习 才 是 最 好 的 老师 。 

Stanford 类 库 提 供 了 TokenScanner 类 ， 它 支持 将 输入 文本 分 解 成 多 个 独立 的 被 称 
为 记号 的 一 个 个 单元 。TokenScanner 类 库 版 本 提供 了 多 种 选择 设置 ， 使 得 该 类 包 
应 用 范围 更 加 广泛 。 

对 于 太 过 复杂 ， 需 要 维护 的 内 部 变量 超过 接受 限度 的 应 用 ， 将 这 个 程序 封装 成 一 个 
类 将 是 很 好 的 选择 。 当 你 使 用 这 种 设计 风格 时 ，main 程序 将 创建 该 类 的 一 个 对 象 ， 
然后 调用 类 中 的 方法 使 得 程序 正常 运行 。 


复习 题 
1. 给 出 以 下 术语 的 定义 对象、 结构 类 型 、 类 、 实 例 变量 和 方法 。 
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2. 在 C++ 的 类 定义 中 ， 关 键 字 public 和 private 的 含义 是 什么 ? 
3. 判 断 题 : 在 C++ 语言 中 ， 关 键 字 struct 和 class 之 间 的 唯一 区 别 就 是 struct 的 默认 数据 域 是 公 
有 的 。 

4. C++ 语言 使 用 什么 操作 符 从 对 象 中 选择 一 个 实例 变量 ? 

5. C++ 语言 构造 函数 的 语法 是 怎样 的 ? 

6. 调用 默认 构造 函数 需要 传人 多 少 个 参数 ? 

7. 什么 是 读 取 器 ? 什么 是 设置 器 ? 

8. 一 个 类 被 称 为 不 可 变 的 是 什么 意思 ? 

9. 当 你 将 类 的 接口 和 实现 分 离 时 ， 类 的 实现 如 何 让 编译 器 知道 一 个 特定 的 方法 定义 属于 哪个 类 ? 

10. 本 章 为 了 防止 用 户 访 问 类 中 私有 部 分 内 容 ,， 在 .h 文件 中 采用 了 那 种 机 制 ? 

11. 在 C++ 语言 中 ， 你 会 使 用 何 种 方法 名 来 重 载 % 操作 符 ? 

12. C++ 语言 怎样 区 别 ++ 和 -=- 操作 符 的 前 级 版 本 和 后 级 版 本 ? 

13. 为 什么 重 载 << 操作 符 的 实现 部 分 需要 返回 变量 的 引用 ? 

14. 判断 题 : 在 C++ 语言 中 ， 引 用 返回 和 引用 调用 的 使 用 频率 一 样 。 

15. 叙述 基于 方法 和 基于 自由 函数 这 两 种 类 操作 符 重 载 方法 的 不 同 点 。 这 两 种 风格 各 自 的 优 缺 点 是 
什么 ? 

16. 在 一 个 类 中 声明 一 个 方法 或 者 其 他 类 声明 为 该 类 的 友 元 意味 着 什么 ? 

17. 本 章 为 Direction 类 型 提供 ++ 操作 符 重 载 的 原因 是 什么 ? 

18. 本 章 中 提出 关于 设计 一 个 类 的 五 个 步骤 是 什么 ? 

19. 什么 是 有 理 数 ? 

20. Rantional 类 构造 函数 为 num 和 den 变量 的 值 设置 了 什么 约束 ? 

21. 图 6-8 中 的 Rational 类 构造 函数 代码 包括 了 对 x 是 否 为 零 的 检查 。 如 果 这 一 检查 被 去 除 ， 
Rational 类 还 能 不 能 正常 工作 ? 

22. 在 图 6-7 中 的 rational.h 文件 中 ,为 何 有 必要 将 操作 符 函 数 +、-、* 和 / 声明 为 友 元 函数 ,但 
是 插入 操作 符 << 函数 却 不 能 进行 类 似 声 明 ? 

23. 什么 是 记号 ? 

24. 从 一 个 字符 串 中 读 取 所 有 记号 的 标准 模式 是 什么 ? 

25. 怎样 初始 化 TokenScanner 对 象 使 得 该 对 象 忽略 输入 中 的 空格 、 制 表 符 和 其 他 空白 字符 ? 

26. 用 你 自己 的 语言 解释 将 程序 做 人 到 一 个 类 中 的 技术 。 


习题 
1. 多 米 诺 骨牌 (dominos) 游戏 通常 使 用 在 两 个 表面 标示 代表 数值 白 点 的 黑色 长 方形 骨牌 。 如 下 图 


所 示 : 


上 图 所 示 的 骨牌 称 为 4-1 骨牌 ， 该 牌 的 左边 部 分 有 四 个 点 ， 右 边 部 分 有 一 个 点 。 
定义 一 个 简单 的 Domino 类 来 代表 传统 的 多 米 诺 骨 牌 。 你 的 类 必须 提供 如 下 功能 : 
一 个 创建 0-0 骨牌 的 默认 构造 函数 
一 个 需要 传人 骨牌 各 边 数 值 参 数 的 构造 函数 
一 个 输出 代表 骨牌 字符 串 的 toString 方法 
两 个 名 称 分 别 为 getLiftDots 和 getRightDots 的 访问 器 方法 
编写 一 个 domino.h 接口 和 一 个 domino.cpp 实现 来 提供 该 类 。 参 照 书本 中 的 例子 ， 所 有 实 
例 变 量 必 须 为 私有 ， 并 且 接 口 必 须 重 载 << 操作 符 以 输出 代表 多 米 诺 骨 牌 的 字符 串 。 
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编写 一 个 创建 从 0-0 到 6-6 一 整套 骨牌 的 程序 来 测试 Domino 类 的 实现 ， 并 且 将 这 些 骨 牌 都 显 
示 在 控制 台中 。 一 套 完 整 的 多 米 诺 骨牌 需要 每 个 骨牌 样式 的 一 张 牌 ， 不 允许 通过 翻转 产生 重复 的 骨 
牌 。 因 此 ， 多 米 诺 骨 牌 堆 中 存在 4-1 骨牌 则 不 能 存在 1-4 骨牌 。 


.定义 一 个 Card 类 来 表示 标准 扑克 牌 ， 牌 面 通过 两 个 组 成 因素 进行 区 别 : 等 级 (rank) 和 花色 (suit). 


等 级 以 整数 1 到 13 的 形式 存储 ， 其 中 A 是 1, J 是 11, QH12, K 是 13。 花 色 是 以 下 枚 举 类 型 中 
的 四 个 常量 之 一 : 


enum Suit = ( CLUBS, DIAMONDS, HEARTS, SPADES }; 


Card 类 必须 提供 以 下 方法 : 
e 一 个 创建 一 张 扑 克 牌 并 允许 在 随后 的 程序 中 对 其 进行 赋值 的 默认 构造 函数 
e 一 个 接受 传人 类 似 "10s" 或 "JD" 等 短 字 符 串 的 构造 函数 
一 个 分 别传 人 等 级 和 花色 参数 的 构造 函数 
一 个 返回 代表 扑克 牌 牌 面 的 短 字 符 串 的 方法 tostring 
访问 器 方法 getRank fll getSuit 
编写 card.h 接口 和 card.cpp 实现 来 提供 Cara 类 。 除 Cara 类 之 外 ，card.h 接口 还 必须 
提供 suit 类 型 ,花色 常量 名 (ACE, JACK, QUEEN, KING) 在 实际 中 将 比 数值 更 常用 ， 并 且 你 必须 
运行 如 下 main 程序 进行 测试 : 
int main() { 

for (Suit suit = CLUBS; suit <= SPADES; suit++) ( 

for (int rank = ACE; rank <= KING; rank++) ( 
cout << " " << Card(rank, suit); 


) 
cout «« endl; 


) 


return 0; 


} 
你 的 程序 必须 产生 如 下 输出 : 





GPoint 类 ， 它 与 本 章 介绍 的 Point 类 相似 ， 不 同 点 只 是 在 运行 时 使 用 了 浮 点 数 来 表示 坐标 而 非 使 
用 整数 来 表示 坐标 。 另 一 个 实用 的 类 是 GRectangle 类， 它 使 用 x 和 y 坐标 表示 一 个 长 方形 区 域 
的 左上 和 角 顶点 ， 并 用 width 和 height 变量 来 表示 长 方形 的 长 和 宽 。 以 在 线 文 档 介 绍 的 GRetangle 
类 为 参考 ， 实 现 GRetangle 类 。 


.上 一 个 习题 中 介绍 了 gtypes.n 接口 中 提供 的 类 ， 使 得 创建 复杂 图 像 的 模式 变 得 更 加 简单 ， 其 中 ， 


部 分 原因 是 因为 这 些 类 的 实现 使 得 在 集合 类 和 其 他 抽象 数据 类 型 中 存储 坐标 信息 的 过 程 变 得 更 加 简 
单 。 例 如 在 本 题 中 ， 你 将 体会 到 GPoint 对 象 构 成 的 矢量 带 来 的 乐趣 。 想 象 一 下 你 在 一 个 矩形 边 
界 中 挫 人 大 头 针 ， 并 且 要 求 这 些 大头 针 必须 在 四 条 边 上 方 的 空间 中 均匀 分 布 ， 其 中 上 部 和 下 部 边界 
上 的 大 头 针 称 为 N_ACRoSsS， 左 部 和 右 部 边界 上 的 称 为 N_DOWN。 为 了 使 用 图 形 窗口 对 这 一 过 程 建 
模 ， 你 需要 创建 一 个 Vector<GPoint> 来 保存 每 一 个 大 头 针 的 坐标 ， 这 些 点 从 左上 和 角 的 点 开始 ， 
并 且 依 照 顺 时 针 方向 环绕 矩形 一 周 ， 如 下 图 所 示 : 
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从 这 里 开始 ， 你 通过 在 大 头 针 之 间 连 线 勾画 出 了 矩形 的 轮廓 ， 连 线 从 0 号 大 头 针 开始 ， 然 后 依 
照 数 值 顺 序 圈 中 每 次 移动 一 定 距离 的 空间 ， 这 一 距离 在 常量 DELTA 中 定义 。 例 如 ， 如 果 DELTA 
值 为 11， 第 一 条 线 是 从 0 号 大 头 针 到 11 号 ， 第 二 条 线 从 11 号 到 22 号 ,第 三 条 线 需 按 顺 时 针 方 向 
数 过 11 个 大 头 针 经 过 起 始点 ， 从 22 号 移动 到 5 号 。 这 一 过 程 一 直 持 续 ， 直 到 划 线 返回 到 0 号 大 头 
fr. 像 往常 一 样 ， 使 用 s 操作 符 可 以 使 环绕 特性 的 实现 变 得 非常 简单 。 

编写 一 个 程序 ， 在 图 像 窗 口中 使 用 更 大 的 N_ACROSS 和 N_DOWN 数值 来 模拟 这 一 过 程 。 例 如 ， 
N ACROSS 的 值 为 50，N_DowN 的 值 为 30， 并 且 DELTA 的 值 为 67 的 时 候 ， 程 序 的 输出 如 图 6-13 
所 示 。 通 过 改变 这 些 常 量 值 ， 你 可 以 创建 其 他 更 奇妙 的 只 有 直线 构成 的 图 画 。 
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6-13 yarn-pattern 程序 的 运行 实例 


5. 扩展 第 2 章 习 题 11 中 的 calendar .h 接口 ， 使 得 该 Date 类 提供 以 下 方法 : 
e 一 个 将 日 期 设 为 1900 年 1 月 1 日 的 默认 构造 函数 。 
e 一 个 传人 月 、 日 和 年 并 将 Date 对 象 初始 化 为 包含 这 些 值 的 构造 函数 。 该 函数 的 调用 例子 如 下 : 
Date moonLanding(JULY, 20, 1969); i 
309 该 语句 将 创建 一 个 moonLanding 变量 ,该 变量 表示 196947 A 20 Ho 
e 一 个 重 载 的 构造 函数 ， 它 将 传人 的 前 两 个 参数 为 了 方便 不 同 地 区 的 用 户 使 用 而 颠倒 了 顺序 。 这 一 
改变 使 得 moonLanding 变量 的 声明 可 以 被 写成 : 


Date moonLanding (20, JULY, 1969); 


© 访问 器 方法 getDay. getMonth fl getYear. 
e 一 个 以 dd-mmm-yyyy 格式 返回 时 间 的 tostring 方 法 ， 其 中 dd 是 一 个 一 位 或 者 两 位 数 的 日 
Jj, mmm 是 一 个 三 字母 的 英文 月 份 简写 ，yyyy 是 一 个 四 位 数 的 年 份 。 因 此 ， 调 用 tostring 
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(moonLanding) 会 返回 字符 串 "20-Jul-1969", 


6. 通过 添加 以 下 重 载 操作 符 来 扩展 calendar.h 接口 : 


- 


© 插入 操作 符 << 

e 关系 操作 符 ==、!=、<、<=、> 和 >= 

e. 表达 式 date 十 n 将 返回 date 之 后 n 天 的 日 期 

e 表达 式 date 一 n 将 返回 date 之 前 n 天 的 日 期 

e KAA di— d; 将 返回 d, 和 d; 之 间 相差 的 天 数 

e 复合 赋值 操作 符 += 和 -=， 该 操作 符 右边 传人 一 个 整 型 数 

e ++ 和 -- 操作 符 的 前 级 和 后 级 形式 

例如 ,假设 你 已 经 定义 了 如 下 变量 : 

Date electionDay(6, NOVEMBER, 2012); 

Date inaugurationDay(21, JANUARY, 2013); 

则 electionDay«inaugurationDay 表达 式 的 值 为 true， 因 为 electionDay 日 期 在 inau- 
gurationDay 之 后 。 计 算 inaugurationDay-electionDay 将 返回 值 76， 这 是 这 两 天 之 间 的 
日 期 间隔 天 数 。 除 此 之 外 ， 这 些 操作 符 的 定义 允许 你 编写 如 下 for 循环 : 


for (Date d = electionDay; d<= inaugurationDay; d++) 


这 一 循环 将 遍历 两 个 日 期 中 的 每 一 天 ， 包 括 这 两 个 日 期 本 身 。 


.对 于 大 多 数 应 用 来 说 ， 产 生 一 系列 以 特定 顺序 组 合 起 来 的 名 称 是 非常 有 用 的 。 例 如 ， 如 果 你 编 


一 个 程序 对 纸 上 的 图 进行 编号 ， 使 得 机 器 自动 返回 有 序 字 符 串 :“Figurel”“Figure2”、 
“Figure3” 等 等 ， 这 一 功能 将 非常 方便 。 除 此 之 外 ， 你 可 能 需要 标记 几何 图 形 中 的 点 ， 使 得 标记 
之 间 相 似 但 是 可 以 加 以 区 别 ， 比 如 “P0”“P1”“P2” 等 等 。 

如 果 让 这 个 问题 变 得 更 加 广泛 ， 你 需要 一 个 标记 产生 工具 ， 该 工具 允许 用 户 定义 任意 序列 标 
记 ， 每 一 个 标记 由 前 部 (比如 之 前 例子 中 的 “Figure” 或 “P”) 和 一 个 按 序 排列 的 整 型 数组 成 。 因 
为 用 户 可 能 会 需要 不 同 的 序列 同时 被 激活 ， 所 以 将 标记 产生 器 定义 为 LabelGenerator 类 将 非常 
有 用 。 为 了 初始 化 一 个 新 的 标记 产生 器 ， 用 户 需 要 提供 标记 前 绥 字 符 串 和 初始 化 的 下 标 值 作为 参数 
传递 给 构造 函数 LabelGenerator。 在 产生 器 创建 后 ， 用 户 可 以 通过 调用 LabelGenerator 类 
的 nextLabel 方法 返回 新 的 标记 序列 。 

为 了 说 明 接 口 如 何 工作 ， 图 6-14 中 的 main 程序 运行 结果 如 下 图 所 示 : 


igure Figure 
: PO, Pl, P2, P3, P4 


Figure 4, Figure 5, Figure 6 





编写 文件 labelgen.h 和 labelgen.cpp 来 实现 该 类 。 


int main() ( 
LabelGenerator figureNumbers("Figure ", 1); 
LabelGenerator pointNumbers("P", 0); 
cout «« "Figure numbers: "; 
for (int i = 0; i < 3; i++) { 
if (i > 0) cout << ", "; 


cout << figureNumbers. rexthabeii(); 
} 
cout << endl << "Point numbers: "; 
for (int i = 0; i < 5; it+) ( 

Af (à > Q) cout << ", "s 





图 6-14 测试 标记 产生 器 的 程序 
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cout << pointNumbers .nextLabel () ; 
} 
cout << endl << "More figures: "s 
for (int i = 0; i « 3; i++) ( 


if (i > 0) cout << ", 

cout << tigürenmbars. nextLabel(); 
) 
cout «« endl; 
return 0; 





图 6-14 ( 续 ) 


8. 本 书 中 的 Rational 类 定义 了 操作 符 +、-、* 和 /， 但 是 仍然 需要 定义 其 他 操作 符 来 完善 该 类 。 请 
在 接口 和 实现 中 增加 以 下 操作 符 : 
e 关系 操作 符 ==、!=、<、<=、> 和 >= 
。 复合 赋值 操作 符 +=、-=、*= 和 /= 
e ++ 和 -- 操作 符 的 前 级 和 后 级 形式 

9. 重新 实现 图 5-4 中 的 RPN 计算 器 ， 使 得 该 计算 器 内 部 使 用 有 理 数 进行 计算 而 不 是 浮 点 数 。 例 如 ， 
的 程序 运行 时 应 能 产生 以 下 输出 (该 例子 演示 了 有 理 数 运算 的 精确 性 ): 


=> 
= 


Calculator Simulation m H for kaip) 


‘N poA m g 
Wn WHEN DE d 


是 
+N+ anar 


3 0 





10. 编写 一 个 程序 ， 检 查 文 件 中 单词 的 拼写 。 你 的 程序 必须 使 用 TokenScanner 类 从 输入 文件 中 读 取 
记号 ， 然 后 再 依照 第 5 章 介 绍 的 EnglishWords .dat 文件 存储 的 字典 对 每 个 单词 进行 检查 。 如 
果 单 词 不 在 字典 中 ， 程 序 必 须 输出 这 一 检查 结果 。 例 如 ， 如 果 运 行程 序 并 输入 包括 以 下 这 段 话 的 
MAS, SpellCheck 程序 将 产生 以 下 输出 : 





11. 编写 一 个 程序 ， 实 现 一 个 简单 的 计算 器 。 计 算 器 的 输入 包括 了 由 数字 ( 整 型 数 或 者 实数 ) 和 四 则 运 
算 操 作 符 +、-、* 和 / 组 成 的 表达 式 。 针 对 每 一 行 输入 ， 程 序 都 必须 显示 从 左 到 右 运算 所 产生 的 
结果 。 你 应 该 使 用 记号 扫描 器 来 读 取 术 语 和 操作 符 ， 同 时 让 扫描 器 忽略 所 有 的 空白 字符 。 程 序 必 
须 在 用 户 输 入 一 个 空 行 后 退出 。 运 行 该 程序 的 一 个 实例 如 下 : 
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| 

| > 4*8-2*1641/3*6-6748*2-3426-1/3443/742-5 
| 0 

| 






AF AY BR )( The Phantom Toll booth) 中 Mathemagician £i Milo 出 的 问题 。 
12. 扩展 之 前 习题 中 的 程序 ， 使 得 表达 式 中 可 以 出 现 变量 名 ， 该 变量 可 像 下 图 所 示 一 样 通过 简单 的 赋值 
表达 式 进行 赋值 : 


> pi = 3.1415926535 
»rzl1.5 
> área = pi*r*r 





13. Jj TokenScanner 类 实现 saveToken 方法 。 这 一 方法 存储 特定 的 记号 使 得 随后 对 nextToken 
方法 的 调用 直接 返回 存储 的 记号 ， 而 不 用 再 次 对 输入 中 的 字符 进行 扫描 。 你 的 实现 必须 允许 用 户 
存储 多 个 标记 ， 其 中 最 后 存储 的 记号 将 会 被 第 一 个 返回 。 

14. 为 TokenScanner 类 实现 scanStrings 方 法 。 但 调用 scanStrings 方 法 时 ， 记 号 扫描 
器 将 把 引号 当成 一 个 单独 的 字符 返回 。 字 符 串 有 可 能 通过 单 引号 或 者 双 引 号 进行 标示 ， 并 且 
nextToken 方法 必须 将 引号 与 字符 串 一 同 返回 。 

15. Jj TokenScanner 类 实现 scanNumbers 方法 。 该 方法 将 符合 C++ 语言 标准 的 数值 作为 一 个 
单独 的 记号 返回 。 这 一 扩展 的 难点 在 于 理解 什么 是 合法 的 数值 字符 串 ， 并 且 寻 找 一 种 高 效 实现 这 
些 规则 的 方法 。 说 明 这 些 规 则 的 最 简单 方式 就 是 使 用 计算 机 科学 中 的 有 限 状 态 机 ( finite-state 
machine)， 它 通常 被 表示 成 图 ， 其 中 使 用 圆圈 来 表示 有 限 状 态 机 的 所 有 可 能 状态 。 之 后 这 些 圆 圈 
将 被 一 组 标示 箭头 进行 连接 ， 这 些 箭 头 表 明了 该 状态 机 从 一 种 状态 转换 到 另 一 种 状态 的 过 程 。 图 
6-15 展示 了 扫描 一 个 实数 的 有 限 状 态 机 。 


数字 数字 数字 





1729 3.1416 3.0E+9 


状 





RR 
JA A UA FA, fA FA A 


图 6-15 ”扫描 数字 的 有 限 状 态 机 
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当 你 使 用 一 个 有 限 状态 机 时 ， 你 将 从 状态 So 开始 ， 然 后 遵循 标记 箭头 来 处 理 输入 的 每 一 个 字 
符 直 到 没有 可 以 匹配 输入 字符 的 箭头 时 为 止 。 如 果 你 在 一 个 双 线 圈 处 停止 ， 那 么 你 已 经 成 功 地 扫 
描 到 了 一 个 数值 。 这 表明 扫描 成 功 的 状态 被 称 为 终 态 ( final state). E 6-15 展示 了 有 限 状态 机 在 扫 
描 各 种 类 型 的 数字 的 三 个 实例 。 

编写 scanNumbers 代码 来 扫描 记号 的 最 简单 方法 就 是 模拟 有 限 状 态 机 的 运行 过 程 。 你 的 代 
码 必须 保持 对 有 限 状 态 机 中 状态 的 追踪 ， 然 后 每 次 验证 输入 的 一 个 字符 。 每 一 个 字符 都 可 能 标示 
着 数值 的 结尾 或 者 该 状态 机 进入 一 个 新 的 状态 。 


| 第 7 章 


Programming Abstractions in C++ 


递归 简介 


通常 来 说 ， 对 梦想 的 坚定 不 移 让 我 们 梦想 成 真 。 
一 一 威廉 . 3835, 《信仰 的 意志 》( The Woll to Believe), 1897 


大 多 数 用 于 解决 程序 问题 的 算法 策略 在 计算 领域 之 外 都 有 与 之 对 应 的 事物 。 当 你 重复 执 
行 一 个 任务 时 ， 你 就 在 使 用 迭代 。 当 你 做 一 个 决定 时 ， 你 正 运 用 条 件 控制 。 由 于 这 些 都 是 人 
们 熟悉 的 操作 ， 大 多 数 人 在 遇 到 相关 的 小 问题 时 学 会 了 使 用 for. while 以 及 if 这 样 的 控 
制 语句 。 

然而 ， 在 处 理 一 些 复杂 的 程序 任务 之 前 ， 必 须 学 习 一 种 强大 的 问题 处 理 策略 ， 它 在 
现实 世界 中 很 少 有 直接 对 应 的 事物 。 这 种 策略 被 称 为 递归 ( recursion)， 它 被 定义 为 将 大 
问题 通过 简化 成 相同 形式 的 小 问题 来 解决 问题 的 一 种 技术 。 在 递归 定义 中 ,“ 相 同形 式 ” 
这 个 词 是 最 重要 的 ， 它 从 其 他 方面 描述 了 逐步 求 精 法 的 基本 策略 。 递 归 和 逐步 求 精 这 两 种 
策略 都 涉及 分 解 ， 但 递归 的 特殊 之 处 在 于 : 在 其 解决 方案 中 ， 子 问题 和 原 问 题 具 有 相同 的 
形式 。 

如 果 你 和 大 多 数 初级 程序 员 一 样 ， 那 么 当 你 第 一 次 听 到 将 一 个 问题 分 解 成 相同 形式 
的 子 问题 的 思想 时 ， 你 可 能 觉得 它 意义 不 大 。 不 像 重 复 或 者 条 件 检验 ， 递 归 不 是 日 常生 
活 中 出 现 的 一 个 概念 。 正 因为 它 不 常见 ， 因 此 学 习 如 何 使 用 递归 可 能 很 困难 。 为 此 ， 你 
必须 培养 必要 的 直觉 ， 这 种 直觉 能 够 让 递归 看 起 来 和 其 他 所 有 的 控制 结构 一 样 自然 。 对 
于 大 多 数 正 在 学 习 编程 的 学 生 而 言 ， 理 解 递归 需要 大 量 的 时 间 和 练习 。 即 便 如 此 ， 努 力 
学 习 使 用 递归 无 疑 是 值得 的 。 作 为 一 种 解决 问题 的 工具 ， 递 归 非 常 强 大 ， 以 至 于 它 有 时 
看 起 来 近乎 神奇 。 另 外 ， 经 常 使 用 递归 使 得 用 极其 简洁 的 方式 编写 一 个 复杂 的 程序 成 为 
可 能 。 


7.1 一 个 简单 的 递归 例子 


为 了 更 好 地 理解 递归 ， 想 象 一 下 : 假如 你 已 经 被 任命 为 一 个 大 慈善 组 织 的 资金 协调 员 ， 
这 个 组 织 有 很 多 志愿 者 ， 但 是 缺乏 资金 。 你 的 工作 就 是 筹集 1 000 000 美元 以 满足 组 织 的 
Wa 

如 果 你 认识 一 些 愿意 捐献 1 000 000 美元 的 人 ， 你 的 工作 就 很 简单 。 但 是 ， 你 可 能 不 会 太 
幸运 的 拥有 那些 慷慨 上 是 为 百 万 富 俩 的 朋友 。 此 时 ， 你 必须 一 小 笔 一 小 笔 地 来 筹集 这 1 000 000 
美元 。 如 果 平 均 捐 款 为 100 美元 ， 你 可 能 会 选择 一 个 不 同 的 行动 方针 : 给 10 000 个 朋友 打 电 
话 ， 请 求 他 们 每 人 捐款 100 美元 。 但 话说 回来 ， 你 可 能 没有 10 000 个 朋友 ， 那 么 你 该 怎么 
办 呢 ? 

最 常见 的 情况 是 ， 当 你 面临 一 个 超出 你 能 力 的 任务 ， 这 个 问题 的 答案 就 是 将 你 的 
部 分 工作 分 派 给 其 他 人 。 你 的 组 织 有 相当 多 的 志愿 者 。 如 果 你 能 够 在 这 个 国家 的 不 同 
地 区 发 现 10 个 志愿 者 ， 然 后 任命 他 们 为 地 区 协调 员 ， 这 10 个 人 每 人 负责 筹集 100 000 


315 


b 


216 #7 





美元 。 
筹集 100 000 美元 比 筹集 1 000 000 美元 简单 ， 但 这 也 并 非 易 事 。 你 任命 的 地 区 协调 员 
应 该 做 什么 ?如 果 他 们 采取 相同 的 策略 ， 他 们 进而 将 部 分 工作 分 派 给 其 他 人 。 如 果 他 们 每 个 
人 招募 10 名 资金 筹集 志愿 者 ， 这 些 志愿 者 每 人 只 需要 筹集 10 000 美元 。 这 个 分 派 任务 的 过 
程 可 以 一 直 继 续 下 去 ， 直 到 志愿 者 能 够 自己 筹集 到 所 分 派 的 钱 。 由 于 平均 捐款 为 100 美元 ， 
资金 筹集 志愿 者 可 以 从 每 个 捐款 者 那里 筹集 100 美元 ， 这 就 无 须 再 分 派 任务 。 
如 果 你 用 伪 码 表示 这 个 筹集 资金 的 策略 。 它 具有 以 下 结构 : 
void collectContributions(int n) { 
if (n <= 100) { 
Collect the money from a single donor. 
) eise ( 
Find 10 volunteers. 
Get each volunteer to collect n/10 dollars. 
Combine the monev raised by the volunteers. 
} 
} 


这 段 伪 码 翻译 时 最 重要 的 就 是 以 下 这 行 : 

Get each volunteer to collect n/10 dollars. 
它 只 是 简单 地 将 原始 问题 的 规模 减 小 。 任 务 的 基本 特征 (筹集 n 美元 ) 问题 依然 和 原来 完全 
一 样 ; 唯一 不 同 的 是 n 的 值 变 小 了 。 此 外 ， 由 于 问题 是 相同 的 ， 你 可 以 调用 原始 的 函数 来 求 
解 它 。 因 此 ， 伪 码 中 前 面 一 行 最 终 可 以 用 下 面 这 行 替换 : 

collectContributions (n / 10); 


如 果 平 均 捐款 数 大 于 100 美元 ,注意 collectContributions 函数 调用 自身 的 结束 条 件 
是 非常 重要 的 。 在 程序 中 ， 一 个 函数 直接 或 间接 地 调用 自身 正 是 所 定义 的 递归 函数 的 重要 
特点 。 
collectContributions 中 数 的 结构 是 典型 的 递归 函数 。 通 常 ， 递 归 函 数 体 都 具有 
如 下 形式 : 


if (test for simple case) { 
Compute a simple solution without using recursion. 
} else { 
Break the problem down into subproblems of the same form. 
Solve each of the subproblems by calling this function recursively. 
Reassemble the subproblem solutions into a solution for the whole. 


} 


这 个 结构 提供 了 编写 递归 函数 的 模板 ， 因 此 被 称 为 递归 范 型 (recursive paradigm). (KFT LA 
将 这 种 技术 运用 到 编程 问题 中 ， 只 要 该 问题 符合 以 下 条 件 : 

1. 你 一 定 能 够 识别 那些 答案 很 容易 被 确定 的 简单 情况 (simple case) o 

2. 你 一 定 能 够 确定 一 个 递归 分 解 (recursive decomposition)， 这 个 递归 分 解 可 让 你 将 任 
何 复杂 问题 分 解 成 相同 形式 的 更 简单 的 问题 。 

collectContributions 这 个 例子 说 明了 递归 的 强大 。 和 任何 递归 技术 一 样 ， 原 始 
问题 通过 分 解 成 为 更 小 的 子 问 题 来 解决 ， 子 问题 只 是 在 规模 上 与 原 问题 有 差别 。 这 里 ， 原 始 
问题 是 要 筹集 到 1 000 000 美元 。 在 第 一 级 的 分 解 中 ， 每 一 个 子 问题 是 要 筹集 到 100 000 美 
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元 。 然 后 ， 这 些 问 题 进而 被 细 分 为 更 小 的 问题 ， 直 到 问题 足够 简单 ， 直 至 不 需要 再 细 分 就 能 
解决 为 止 。 由 于 该 解决 方法 依赖 于 将 复杂 问题 分 解 成 相同 形式 的 更 简单 的 问题 ， 因 此 ， 这 种 
递归 形式 的 解决 方法 通常 被 称 为 分 治 (divide-and-conquer) 算法 。 


7.2 阶乘 函数 


RE collectContributions 这 个 例子 说 明了 递归 的 思想 ， 但 是 它 并 没有 揭示 递归 
在 实际 中 是 如 何 使 用 的 ， 这 大 部 分 原因 是 组 成 解决 方法 的 步 又， 例如 招募 10 名 志愿 者 然后 
筹 钱 ， 都 不 能 在 C++ 程序 中 简单 地 表示 出 来 。 为 了 得 到 对 递归 性 质 的 一 个 实际 理解 ， 你 需 
要 思考 那些 更 容易 适用 于 编程 领域 的 问题 。 

对 于 大 多 数 人 来 说 ， 理 解 递归 最 好 的 方法 就 是 从 简单 的 数学 函数 开始 ， 其 中 ， 递 归 的 结 
构 直 接 伴 随 着 问题 的 描述 出 现 而 很 容易 被 理解 。 其 中 ， 最 常见 的 是 阶乘 函数 (数学 上 习惯 表 
示 为 nl)， 它 被 定义 为 在 1 到 n 之 间 的 所 有 整数 的 乘积 。 在 C++ 中 ,与 之 等 价 的 问题 是 编写 
具有 如 下 原型 的 函数 : 


int fact(int n); 


该 函数 从 参数 中 获取 一 个 整数 n， 并 返回 其 阶乘 结果 。 
正如 你 可 能 以 你 的 编程 经 验 中 所 了 解 的 那样 ， 使 用 for 循环 编写 fact 函数 非常 简单 ， 
正如 以 下 实现 代码 所 展示 的 : 
int fact(int n) ( 
int result - 1; 
for (int i = 1; i <= n; i++) { 
result *= i; 
) 


return result; 


) 


该 实现 代码 使 用 了 一 个 for 循环 来 循环 遍历 1 到 n 之 间 的 每 个 整数 。 而 在 递归 实现 中 ， 并 
不 存在 这 个 循环 。 取 而 代 之 的 是 通过 直接 递归 调用 以 产生 相同 的 结果 。 

使 用 循环 (典型 的 通过 使 用 for 和 while 语句 ) 的 实现 方法 被 称 为 迭代 (iterative )。 
办 代 和 递归 通常 被 看 成 是 完全 相反 的 两 种 策略 ， 因 为 它们 用 完全 不 同 的 方法 来 解决 相同 的 问 
题 。 然 而 ， 这 两 种 策略 并 非 相 互 排 斥 。 递 归 函 数 内 部 有 时 候 也 包含 迭代 。 尽 管 本 章 的 例子 纯 
粹 全 部 采用 递归 ， 但 是 你 将 会 在 第 8 章 见 到 这 种 技术 的 例子 。 


7.2.1 fact 的 递归 公式 

然而 ，fact 的 迭代 实现 并 没有 利用 阶乘 的 一 个 重要 的 数学 性 质 。 每 一 个 阶乘 都 与 下 一 
个 更 小 的 整数 的 阶乘 相关 ， 如 下 所 示 : 

n!2-nxí(n-1)! 
因此 ，4! 是 4X3!，3! 是 3X2!， 以 此 类 推 。 为 了 确保 阶乘 计算 过 程 在 某 处 终止 ， 数 学 上 定 
义 了 0! 为 1。 因此， 阶乘 函数 的 传统 数学 定义 如 下 : 

- 1 # n=0 

a Meer 其 他 
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这 个 定义 是 递归 的 ， 因 为 它 根 据 n 一 1 的 阶乘 定义 了 n 的 阶乘 。 新 的 问题 (计算 n— 1 的 阶 
R) 和 原始 的 问题 有 同样 的 形式 ， 这 种 形式 是 递归 的 基本 特征 。 你 之 后 可 以 使 用 相同 的 过 程 
根据 (n 一 2 ) ! 来 定义 (n—1) ) !。 此 外 ， 你 可 以 一 步 一 步 地 向 前 递 推 这 个 过 程 ， 直 至 解决 方 
案 被 表达 成 0 ! ,根据 定义 01 等 于 1。 
从 程序 员 的 观点 来 看 ， 递 归 数 学 定义 的 实际 影响 是 ， 它 为 其 实现 方法 提供 了 一 个 模板 。 
用 C++ 你 可 以 实现 一 个 如 下 的 计算 其 参数 的 阶乘 函数 fact: 
int fact(int n) ( 
if (n == 0) { 
return 1; 
} else { 
return n * fact(n - 1); 


) 
) 


如 果 n 等 于 0，fact 函数 的 结果 为 1。 如 果 n 不 等 于 0， 该 实现 通过 调用 fact (n-1), # 


后 将 这 个 结果 乘 以 n 来 计算 结果 。 该 实现 直接 遵循 了 阶乘 函数 的 数学 定义 ， 并 且 恰 好 具有 递 
归结 构 。 


7.2.2 ”追踪 递归 过 程 

如 果 根 据 递归 的 数学 定义 ， 编 写 fact 的 递归 实现 会 很 简单 。 然 而 ， 尽 管 依 据 定义 易于 
编写 出 代码 ， 但 过 于 简短 的 答案 似乎 令 人 怀疑 。 当 你 第 一 次 学 习 递 归 时 ，fact 的 递归 实现 
看 起 来 遗漏 了 某 些 东西 。 即 使 它 清楚 地 反映 了 数学 定义 ， 递 归公 式 使 你 难以 确定 实际 的 计算 
步骤 。 例 如 ， 当 你 调用 fact 函数 时 ， 你 想 要 计算 机 给 出 答案 。 在 这 个 递归 实现 中 ， 你 能 看 
到 的 只 是 一 个 公式 ， 它 将 一 个 fact 调用 转化 成 另 一 个 fact 调用 。 由 于 计算 步骤 不 明显 ， 
因此 当 计算 机 给 出 正确 答案 时 ， 它 看 起 来 有 点 神奇 。 

然而 ， 如 果 你 跟踪 计算 机 的 函数 调用 逻辑 ， 你 会 发 现 其 中 没有 涉及 任何 魔法 。 当 计算 机 
计算 一 个 递归 函数 fact 的 调用 时 ， 和 计算 其 他 任何 函数 调用 一 样 经 历 了 相同 的 过 程 。 为 了 
使 这 个 过 程 可 视 化 ,假设 你 已 经 执行 了 main 函数 中 的 以 下 这 条 语句 : 


cout << "fact(4) = " << fact(4) << endl; 


34 main 函数 调用 fact 函数 时 ， 计 算 机 创建 了 一 个 新 的 栈 帧 并 将 实 参 值 复 制 给 形 参 变量 n。 
fact 函数 的 栈 帧 暂时 取代 了 main 函数 的 栈 帧 ， 如 下 图 所 示 : 


int fact(int n) ( 
sif (n == 0) ( 
return 1; 
) else ( 
return n * fact(n - 1); 


REN ER 


图 中 栈 帧 内 部 显示 了 fact 函数 体 代 码 ， 它 使 你 很 容易 跟踪 程序 中 的 当前 位 置 。 图 中 
当前 位 置 指示 符 出 现在 代码 的 开始 处 ， 因 为 所 有 的 函数 调用 都 从 函数 体 的 第 一 条 语句 
开始 。 

现在 ， 从 if 语句 开始 ， 计 算 机 开始 执行 函数 体 。 由 于 n 不 等 于 0， 控 制 行进 至 else 
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分 句 ， 此 时 程序 必须 计算 并 返回 以 下 表达 式 的 值 : 
n * fact(n = 1) 


计算 该 表达 式 需 要 计算 fact (n-1) 的 值 ， 它 引入 了 一 个 递归 调用 。 当 该 调用 返回 时 ， 程 序 
必须 将 得 到 的 结果 乘 以 n。 因 此 ， 当 前 的 计算 状态 可 用 下 图 表示 : 


int fact(int n) ( 
if (n == O) { 
return 1; 


) eise ( 
return n * fact(n - 1); 
) 
) - -一 - 
一 旦 调用 fact (n-1) 返回 值 ， 其 结果 将 取代 图 中 划 线 的 表达 式 ， 以 便 计 算 过 程 继续 进行 
下 去 。 
计算 的 下 一 步 为 进行 函数 调用 fact (n-1) ， 首 先 计算 该 函数 的 参数 表达 式 。 由 于 n 的 

当前 值 为 4， 则 参数 表达 式 n 一 1 的 值 为 3。 之 后 计算 机 为 fact 函数 创建 了 一 个 新 的 栈 帧 ， 
其 中 ， 形 参 变量 被 初始 化 为 3。 因 此 ， 下 一 栈 帧 看 起 来 如 下 图 所 示 : 





| exif (n == 0) { 
return 1; 
} else ( 
return n * fact(n - 1); 





现在 ， 这 里 有 两 个 被 标记 为 fact 的 栈 帧 。 在 最 近 的 栈 帧 中 ， 计 算 机 正 开 始 计算 
fact (3) 。 这 个 新 的 栈 帧 覆盖 了 之 前 的 fact (4) 栈 帧 ， 直 到 fact (3) 计算 完成 才 会 再 次 
出 现 fact (4) 栈 帧 。 

以 测试 n 的 值 开始 再 次 计算 fact (3) 。 由 于 n 仍 不 为 0，else 分 句 通知 计算 机 计算 
fact (n-1) 。 和 之 前 一 样 ， 这 个 过 程 需要 创建 一 个 新 的 栈 帧 ， 如 下 图 所 示 : 





遵循 同样 的 逻辑 ， 现 在 ， 程 序 必 须 调 用 fact (1) ， 继 而 调用 fact (0) ， 创 建 两 个 新 的 栈 
帧 ， 如 下 网 所 示 : 


* 
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Sii mif (n == 0) { 
return 1; 
} else { 
return n * fact(n - 1); 





然而 ， 此 时 情况 发 生 了 改变 。 由 于 n 的 值 为 0， 函 数 将 通过 执行 以 下 语句 立即 返回 
结果 : 


return 1; 


值 1 被 返回 到 调用 栈 帧 ， 这 将 恢复 它 在 上 层 栈 帧 中 的 位 置 ， 如 下 图 所 示 : 


int fact(int n) ( 


if (n == 0) ( 
return 1; 
) eise ( 
return n * fact(n - 1); 


T ti [1] 


n 





依据 上 述 方式 ， 通 过 每 次 递归 调用 返回 使 计算 执行 下 去 ， 即 通过 返回 值 来 完成 每 一 层 
的 计算 。 例 如 ， 在 当前 栈 帧 中 ， 调 用 fact (n-1) 能 被 值 1 替换 ， 正 如 关于 栈 帧 的 图 所 示 。 
在 这 个 栈 帧 中 ，n 的 值 为 1， 因 此 该 调用 的 结果 就 是 1。 该 结果 被 返回 给 它 的 调用 者 并 被 下 
图 中 的 上 一 层 栈 帧 替换 。 


if (n == 0) { 
return 1; 
} else { 
return n * fact(n - 1); 





由 于 nm 现在 为 2，return 语句 的 执行 结果 为 2， 并 且 该 值 将 会 被 返回 给 前 一 级 ， 如 下 图 
Br: 


1 J] fy AM 221 


int fact(int n) ( 


if (n == 0) ( 
return 1; 
) eise ( 
return n * fact(n - 1); 





在 此 阶段 ， 程 序 将 3X2 返回 给 它 的 前 一 级 ， 因 此 ， 初 始 调用 fact 的 栈 帧 如 下 图 所 示 : 





| if (n == 0) ( 
return 1; 


) else ( 
return n * fact(n - 1); 





计算 过 程 的 最 后 一 步 包括 计算 4x6 以 及 将 值 24 返回 给 主 程序 。 


7.23 ”递归 的 稳步 跳跃 


包含 fact (4) 计算 的 完整 跟踪 过 程 的 意义 使 你 确信 : 计算 机 将 递归 函数 与 其 他 函数 同 
等 对 待 。 当 你 面 对 一 个 递归 函数 时 ， 至 少 在 理论 上 ， 你 可 以 模拟 计算 机 的 操作 ， 并 且 和 弄 明 
白 它 将 做 什么 。 通 过 画 出 所 有 栈 帧 和 跟踪 所 有 的 变量 值 ， 你 可 以 复制 出 完整 的 操作 并 给 出 
答案 。 然 而 ， 如 果 你 这 样 做 ， 你 会 经 常 发 现 其 过 程 的 复杂 性 会 以 计算 过 程 无 法 继续 跟踪 而 
结束 。 

每 当 你 试图 理解 一 个 递归 程序 时 ， 将 基本 细节 隐藏 ， 取 而 代 之 的 是 应 集中 于 某 个 层次 上 
的 操作 是 非常 有 用 的 。 在 那个 层次 上 ， 你 可 以 假设 : 只 要 那 层 调 用 的 参数 在 某 种 意义 上 比 原 
始 的 参数 简单 ， 所 有 的 递归 调用 都 能 自动 得 到 正确 的 答案 。 这 种 心理 上 的 策略 (假设 任何 更 
简单 的 递归 调用 将 正确 地 工作 ) 被 称 为 递归 的 稳步 跳跃 ( recursive leap of faith)。 在 实际 应 
用 中 使 用 递归 时 ， 学 会 运用 这 种 策略 是 非常 重要 的 。 

例如 ， 考 虑 一 下 : 当 n 的 值 为 4 时 ， 计 算 fact (n) 会 发 生 什 么 ? 为 此 ， 递 归 实 现 必须 
计算 以 下 表达 式 的 值 : 

n * fact(n - 1) 
将 n 代 和 人 到 上 述 表 达 式 ， 则 得 到 : 


4 * fact(3) 


此 时 ,计算 fact (3) 比 计算 fact (4) 简单 。 因 此 ,递归 的 稳步 跳跃 允许 你 假设 它 已 
起 作用 了 。 因 此 ， 你 可 以 假设 调用 fact (3) 能 正确 地 计算 出 31 WA, 它 是 3x2x1 或 者 
6。 因 此 ， 调 用 fact (4) 的 结果 是 4x6 或 者 24。 

正如 你 在 本 章 剩余 部 分 的 例子 中 所 看 到 的 ， 总 是 尝试 专注 于 大 局 而 非 细 节 。 一 旦 你 已 经 
完成 了 递归 分 解 并 有 旦 确定 了 简单 情况 ， 则 相信 计算 机 可 以 处 理 剩余 的 部 分 。 
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7.3 ERMAK 


在 1202 年 出 版 的 《算法 之 书 》(Liser Abbaci) 中 的 一 个 数学 模型 中 ， 意 大 利 数学 家 列 奥 
纳 多 ' 斐 波 那 契 提 出 了 一 个 在 很 多 领域 ， 包 括 计算 机 科学 领域 都 具有 重要 影响 的 一 个 问题 。 
该 问题 作为 人 口 生物 学 (最 近 几 年 正 逐 渐变 得 十 分 重要 的 领域 ) 中 的 一 个 例子 首次 被 提出 。 
裴 波 那 契 的 问题 是 关于 兔子 的 总 数 是 如 何 一 代 一 代 地 增长 的 ， 如 果 免 子 生 育 是 根据 以 下 公认 
的 规则 进行 : 

e 每 一 对 成 年 的 兔子 每 个 月 生产 一 对 新 的 兔子 。 

e 兔子 在 生 下 来 的 两 个 月 之 后 变 成 成 年 兔子 。 

e 老 的 兔子 永远 不 会 死亡 。 
假设 在 某 年 的 一 月 有 一 对 新 出 生 的 兔子 ， 当 这 年 结束 时 共有 多 少 对 兔子 ? 

通过 在 这 一 年 每 个 月 记录 下 兔子 的 总 数目 ， 你 可 以 简单 地 解决 这 个 斐 波 那 契 问题 。 在 一 
月 初 ， 没 有 兔子 ， 由 于 在 这 个 月 的 某 个 时 候 第 一 对 兔子 刚 被 引进 ， 这 导致 了 二 月 一 号 只 有 一 
对 兔子 。 由 于 初始 的 这 对 兔子 是 新 出 生 的， 它们 在 二 月 的 时 候 还 没有 成 年 ， 这 意味 着 在 三 月 

325] 一 号 依然 只 有 原来 的 那 对 兔子 。 然 而 ， 在 三 月 ， 这 对 兔子 到 了 生产 的 年 龄 ， 这 也 就 意味 着 一 
对 新 的 兔子 出 生 了 。 在 四 月 一 号 的 时 候 ， 这 对 新 出 生 的 兔子 增加 了 种 群 的 数量 ( 若 用 “对 ” 
来 计算 的 话 ) 则 达到 了 两 对 。 在 四 月 ， 原 来 的 那 对 兔子 继续 生产 ,但 是 三 月 出 生 的 那 对 兔子 
还 太 年 轻 。 因 此 ， 在 五 月 开始 的 时 候 ， 这 里 有 三 对 兔子 。 从 此 ， 随 着 每 个 月 有 越 来 越 多 的 免 
子 成 年 ， 免 子 的 总 数 开始 增加 得 越 来 越 快 。 


7.3.1 计算 斐 波 那 契 数列 项 

此 时 ， 将 迄今 为 止 的 兔子 按 月 总 数 记录 成 一 个 数字 序列 是 非常 有 用 的 ， 该 序列 用 下 标 
值 t 表示 ,ti 表示 从 某 年 的 一 月 一 号 的 实验 开始 到 第 i 个 月 兔子 的 总 对 数 。 这 个 序列 被 称 
Fy SER FABRA (Fibonacci sequence)， 且 以 下 述 项 开始 ， 它 表示 到 目前 为 止 的 计算 结果 : 


0 1 BY .2 3 


你 可 以 通过 仔细 地 观察 来 简化 这 个 数列 中 更 多 项 的 计算 。 由 于 问题 中 的 兔子 永远 不 会 
死 ， 前 一 个 月 中 所 有 的 兔子 在 这 个 月 中 仍然 存在 。 此 外 ， 每 一 对 成 年 的 兔子 生产 出 一 对 新 的 
兔子 。 能 够 繁殖 的 成 年 兔子 的 数量 就 是 前 一 个 月 中 所 有 的 兔子 的 数量 。 净 效应 是 序列 中 的 每 
个 新 项 一 定 是 前 面 两 项 之 和 。 因 此 ， 斐 波 那 契 数 列 中 接 下 来 的 几 项 看 起 来 如 下 所 示 : 

bh f. bh bh ty ts  t fg tg ty ty to 

0 1 l 2 3 5 8 13 21 34 55 89 144 
因此 ， 这 年 结束 时 兔子 的 总 对 数 是 144。 

从 编程 的 角度 来 看 ， 它 帮助 我 们 使 用 下 面 更 加 数学 化 加 形式 来 表达 生成 这 一 斐 波 那 契 数 
列 新 项 的 规则 : 


In = tn- + tn-2 
在 该 类 型 的 表达 式 中 ， 一 个 序列 的 每 个 元 素 由 其 之 前 的 元 素 确 定 ， 这 被 称 为 递归 关系 
(recurrence relation ) 。 
单独 的 递归 关系 不 足以 定义 斐 波 那 契 数 列 。 虽然 上 述 公式 使 得 计算 该 数列 的 新 项 变 得 更 加 
容易 ， 但 是 这 个 过 程 必须 从 某 个 地 方 开 始 。 为 了 应 用 此 公式 ， 你 至 少 需要 两 个 已 知 项 ， 这 意味 
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着 序列 中 开始 的 两 项 (to 和 4 ) 必须 被 明确 地 定义 。 因 此 ， 斐 波 那 契 数列 完整 的 描述 应 为 : 
Ü 车 n 是 0 或 1 
Initin 其 他 


这 个 数学 公式 对 于 函数 fib (n) 的 递归 实现 是 一 个 理想 的 模型 ， 它 的 作用 是 计算 斐 波 
那 契 数列 中 的 第 n 项。 你 所 需要 做 的 就 是 将 简单 示例 以 及 递归 关系 插入 到 标准 的 递归 模式 
中 。fib (n) 的 递归 实现 方法 展示 在 图 7-1 中 ， 它 同时 包含 了 一 个 测试 程序 ， 其 作用 是 显示 
斐 波 那 契 数 列 中 两 个 给 定 的 项 。 


tn 


/* 
* File: Fib.cpp 


* This program lists the terms in the Fibonacci sequence with 
* indices ranging from MIN INDEX to MAX INDEX. 
«/ 


#include <iostream> 
#include <iomanip> 
using namespace std; 


/* Constants */ 


const int MIN_INDEX = 0; /* Index of first term to generate */ 
const int MAX INDEX = 20; /* Index of last term to generate  */ 


/* Function prototypes */ 


int fib(int n); 


/* Main program */ 


int main() ( 
cout «« "This program lists the Fibonacci sequence." «« endl; 
for (int i = MIN INDEX; i <= MAX INDEX; i++) ( 
if (i « 10) cout «« " "; 
cout «« "fib(" «« i «« ")"; 
cout << " = " << setw(4) << fib(i) << endl; 
} 


return 0; 


* Function: fib 
Usage: int f = fib(n); 


Returns the nth term in the Fibonacci sequence using the 
following recursive formulation: 


fib(0) = 0 

fib(1) = 1 

fib(n) = fib(n - 1) + fib(n - 2) 
/ 


int fib(int n) ( 
if (n < 2) ( 
return n; 
} else { 
return fib(n - 1) + fib(n - 2); 





图 7-1 列 出 斐 波 那 契 数列 的 程序 


7.3.2 在 递归 实现 中 获得 自信 


既然 你 已 经 有 了 函数 fib 的 一 个 递归 实现 ， 那 么 如 何 使 自己 确信 它 能 够 工作 ? 你 可 以 从 
不 断 地 跟踪 程序 的 运行 逻辑 开始 。 例 如 ， 考 虑 一 下 ， 如 果 你 调用 了 fib (5) 将 会 发 生 什 么 ? 
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由 于 这 里 没有 出 现 if 语句 中 列举 的 简单 情况 ， 因 此 将 通过 执行 以 下 语句 得 出 计算 结果 。 
return fib(n - 1) + fib(n - 2); 

它 等 价 于 以 下 语句 : 
return fib(4) 4 fib(3); 


此 时 ， 计 算 机 计算 fib (4) 的 结果 ， 再 加 上 调用 fib (3) 的 结果 而 得 到 最 终结 果 ， 然 后 作 
为 fib(5) 的 值 返回 求 和 结果 。 

但 是 计算 机 是 如 何 计算 fib (4) 以 及 fib (3) 的 呢 ? 当然 ， 答 案 是 它 使 用 了 完全 相同 
的 策略 。 递 归 的 本 质 就 是 将 原 问 题 分 解 成 更 简单 的 问题 ， 并 且 这 些 更 简单 的 问题 可 以 通过 调 
用 完全 相同 的 函数 解决 。 这 些 调 用 被 分 解 成 更 简单 的 调用 ， 这 种 分 解 一 直 持 续 下 去 ， 直 到 达 
到 最 简单 的 情况 为 止 。 

另 一 方面 ， 最 好 是 将 完整 的 机 制 视 为 无 关 紧 要 的 细节 。 取 而 代 之 的 是 ， 仅 牢记 递归 的 
稳步 跳跃 即 可 。 此 时 ， 你 的 工作 就 是 理解 fib (5) 的 调用 是 如 何 工作 的 。 在 逐步 了 解 函 数 
的 执行 过 程 时 ， 你 已 经 成 功 地 将 问题 转换 成 计算 fib (4) 和 fib (3) 之 和 。 因 为 函数 的 参 
数值 更 小 ， 上 述 每 一 个 调用 都 代表 了 一 种 更 简单 的 情况 。 运 用 递归 的 稳步 跳跃 ， 你 可 以 假设 
程序 在 没有 被 仔细 检查 所 有 步骤 的 情况 下 能 够 正确 地 计算 出 每 一 个 函数 调用 值 。 为 了 达到 验 
证 递归 策略 的 目的 ， 你 可 以 看 看 表格 中 的 答案 : fib(4) #3, fib(3) 是 2。 因 此 ， 调 用 
fib(5) 的 结果 就 是 3 十 2， 即 5， 这 确实 是 正确 的 答案 ,示例 结 束 。 你 不 需要 了 解 所 有 的 细 
节 ， 这 些 细节 最 好 交 给 计算 机 处 理 。 


7.3.3 ”递归 实现 的 效率 


然而 ， 如 果 你 决定 检查 关于 计算 fib (5) 调用 的 细节 ， 你 很 快 会 发 现 这 个 计算 的 效率 
是 非常 低 的 。 递 归 分 解 产 生 了 很 多 宛 余 的 调用 ， 其 中 ， 计 算 机 在 多 次 计算 斐 波 那 契 数列 中 相 
同 的 项 后 终止 。 图 7-2 说 明了 这 种 情况 ， 它 展示 了 计算 fib (5) 所 需 的 所 有 递归 调用 。 正 如 
你 从 图 中 所 看 到 的 ， 这 个 程序 最 终 调用 了 一 次 fib (4) 、 两 次 fib (3) 、 三 次 fib(2)、 五 
次 fib (1) ,以 及 三 次 fib (0) 。 假 设 斐 波 那 契 函数 可 以 用 迭代 高 效 地 实现 ， 则 递归 实现 所 
需 的 指数 级 增长 的 步骤 就 有 些 令 人 烦恼 。 


fib(5) 


fib(4) fib(3) 


) 
> 


fib(1) fib(1) fib (0) fib (1) fib (0) 


fib (2) 
/\ | | | || 
1 1 0 1 0 


图 7-2 HA fib (5) 的 步骤 
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7.3.4 递归 不 应 被 指责 


在 发 现 图 7-1 中 给 出 的 fib (n) 的 实现 效率 很 低 之 后 ， 很 多 人 都 忍 不 住 将 矛头 指向 递归 。 
然而 ， 斐 波 那 契 例子 的 问题 与 递归 本 身 无 关 ， 相 反 的 是 与 递归 的 使 用 方式 有 关 。 通 过 采用 
一 种 不 同 的 策略 ， 编 写 一 个 可 消除 图 7-2 所 示 的 大 规模 低 效 之 处 的 fib 函数 的 递归 实现 是 可 
能 的 。 

使 用 递归 时 ， 避 免 低 效 是 常态 ， 其 关键 在 于 采用 一 种 更 通用 的 方法 以 找到 一 种 更 高 效 的 
解决 方案 。 斐 波 那 契 数列 并 不 是 唯一 的 由 以 下 递归 关系 定义 其 项 的 序列 : 


tn = tri + tn2 


根据 你 选择 头 两 项 的 方式 ， 你 可 以 产生 许多 不 同 的 序列 。 传 统 的 斐 波 那 契 数列 : 
0, 1, 1,2, 3, 5, 8, 13, 21, 34, 55, 89, 144, + +- 


由 定义 t= 二 0 和 tb=1 得 到 。 例 如 ， 如 果 定 义 了 t=3 和 tbt=7， 取 而 代 之 ， 你 会 得 到 以 下 
序列 : 

3, 7, 10, 17, 27, 44, 71, 115, 186, 301, 487, 788, 1275,，… 
类 似 地 ， 若 定义 t= 二 -1 以 及 t= 二 2， 将 会 产生 以 下 序列 : 

-1, 2, 1, 3, 4, 7, 11, 18, 29, 47, 76, 123, 199, - -- 


这 些 序列 都 使 用 了 相同 的 递归 关系 ， 这 个 递归 关系 指出 了 每 一 个 新 项 都 是 前 两 项 之 和 。 
上 述 序列 唯一 不 同 之 处 在 于 其 开始 两 项 的 选择 不 同 。 作 为 一 种 通用 的 类 别 ， 将 遵循 这 种 模式 
的 序列 称 为 可 加 序列 (additive sequence). 

这 种 可 加 序列 的 概念 能 够 将 求 斐 波 那 契 数列 中 的 第 n 项 的 问题 转化 成 更 一 般 的 问题 ， 即 
找 出 初始 两 项 为 t 和 t 的 可 加 序列 的 第 n 项 。 这 样 的 函数 需要 三 个 参数 ， 并 且 在 C++ 中 可 
以 被 表示 成 一 个 具有 以 下 原型 的 函数 : 


int additiveSequence(int n, int t0, int t1); 


如 果 你 有 这 样 一 个 函数 ， 那 么 使 用 它 来 实现 fib 是 很 简单 的 。 你 所 需要 做 的 就 是 提供 开始 两 
项 的 正确 值 。 如 下 所 示 : 
int fib(int n) { 


return additiveSequence(n, 0, 1); 


) 


该 函数 体 仅 包含 了 一 行 代码 ， 它 所 做 的 是 只 调用 另 一 个 传递 几 个 额外 参数 的 函数 。 这 类 仅 简 
单 地 返回 另 一 个 通常 以 某 种 方式 改变 参数 后 的 函数 的 结果 的 函数 被 称 为 包装 器 (wrapper) K 
数 。 包 装 器 函数 在 递归 编程 中 非常 普遍 。 在 大 多 数 情况 下 ， 一 个 包装 器 函数 被 用 于 为 一 个 辅 
助 函数 提供 额外 的 参数 来 解决 一 个 更 一 般 的 问题 。 

由 此 ， 剩 下 的 一 个 任务 就 是 实现 函数 additiveSsequence。 如 果 你 花费 几 分 钟 思考 一 
下 这 个 更 一 般 的 问题 ， 你 会 发 现 可 加 序列 自身 有 一 个 很 有 趣 的 递归 特性 。 递 归 的 简单 情况 包 
FE to 和 ti 两 项 ， 它 们 的 值 是 序列 定义 的 一 部 分 。 在 C++ 实现 中 ， 这 些 项 的 值 作 为 参数 被 传 
递 。 例 如 ， 如 果 你 需要 计算 tt， 你 所 需 做 的 只 是 返回 参数 too 

然而 ， 如 果 你 被 要 求 找 出 序列 中 更 大 的 项 呢 ? 例如 ， 人 很 设 你 想 找 出 可 加 序列 中 的 tk， 其 
中 ， 这 个 可 加 序列 的 初始 两 项 是 3 和 7。 通过 查看 下 面 这 个 序列 项 的 列表 : 
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fo tj t l3 t4 ts t6 t fg ly 

3 T 10 17 27 44 71 15 186 301 
你 可 以 看 出 正确 的 值 是 71。 然 而 ,一 个 有 趣 的 问题 是 你 如 何 使 用 递归 来 确定 这 个 结果 。 

你 需要 发 现 的 关键 点 是 任何 可 加 序列 的 第 n 项 是 从 可 加 序列 开始 一 步 一 步 推进 到 第 n 一 
1 项 的 。 例 如 ， 上 例 展示 的 序列 中 的 t 仅 是 以 7 和 10 开始 的 ， 直 至 可 加 序列 中 的 ts 项 之 和 : 


和 tf tf d 6 ts k b dg 
7 10 17 27 44 7» 15 186 301 


331] 这 种 深入 的 观察 使 得 可 实现 如 下 的 additiveSequence PAM: 


int additiveSequence(int n, int t0, int tl) { 
if (n == 0) return t0; 
if (n == 1) return tl; 
return additiveSequence(n - 1, tl, tO * t1); 
) 
如 果 你 跟踪 采用 这 种 技巧 实现 的 fib (5 ) 的 计算 步 又， 会 发 现 这 个 计算 没有 涉及 困扰 前 
面 递 归公 式 那 样 的 宛 余 计算 。 这 些 步骤 直接 解决 问题 ， 如 下 图 所 示 : 
Eib(5) 
= additiveSequence(5, 0, 1) 
= additiveSequence(4, 1, 1) 
= additiveSequence(3, 1, 2) 
= additiveSequence(2, 2, 3) 
- additiveSequence(1, 3, 5) 
-5 
即使 新 的 实现 是 完全 递归 的 ， 它 和 传统 迁 代 版 本 的 斐 波 那 契 函数 相 比 更 高 效 。 事 实 上 ， 我 们 
能 够 使 用 更 复杂 的 数学 方法 编写 一 个 fib (n) 函数 完整 的 递归 实现 ， 这 种 实现 方法 被 认为 比 
迭代 策略 更 高 效 。 你 将 有 机 会 在 第 10 章 的 习题 中 亲自 编写 这 个 实现 。 


7.4 检测 回 文 


尽管 阶乘 和 斐 波 那 契 函数 提供 了 很 好 的 关于 递归 函数 是 如 何 运行 的 例子 ， 但 是 它们 本 
质 上 都 属于 数学 范畴 ， 因 此 ， 可 能 会 传递 一 个 错误 的 印象 ， 即 递归 只 适用 于 数学 函数 。 事 实 
上 ， 你 可 以 将 递归 运用 到 任何 问题 中 ， 只 要 这 个 问题 可 以 被 分 解 成 相同 形式 的 更 小 问题 。 因 
此 ， 多 考察 几 个 递归 实例 ， 并 将 关注 点 放 在 非 数 学 的 特性 上 将 是 非常 有 用 的 。 例 如 ， 本 节 用 
一 个 简单 的 字符 串 应 用 说 明 递 归 的 使 用 。 

一 个 回 文 (palindrome) 是 一 个 其 正 序 和 倒序 读 取 都 是 完全 相同 的 字符 串 ， 例 如 “level” 
和 “noon” 均 为 回 文 。 尽 管 通过 迭代 字符 串 中 的 字符 来 检查 其 是 否 是 一 个 回 文 很 简单 ， 但 
回 文 也 可 以 被 递归 地 定义 。 你 需要 深入 观察 的 就 是 多 于 一 个 字符 的 任何 回 文 在 其 内 部 一 定 包 
含 了 一 个 更 短 的 回 文 。 例 如 ， 字 符 串 “1level” 由 回 文 “eve” 和 一 个 出 现在 两 端的 “1” 组 
成 。 因 此 ， 为 了 检查 一 个 字符 串 是 否 是 一 个 回 文 一 一 假设 这 个 字符 串 足 够 长 ， 不 至 于 它 是 仅 

332] 由 一 个 字符 构成 的 字符 串 这 种 最 简单 的 情况 一 一 那么 你 所 需要 做 的 就 是 : 
1. 检查 其 首 字符 和 最 后 一 个 字符 是 否 相 同 。 
2. 检查 删除 首 字 符 和 最 后 一 个 字符 之 后 产生 的 子 串 是 否 是 一 个 回 文 。 
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若 以 上 两 个 条 件 均 满 足 ， 则 这 个 字符 串 就 是 一 个 回 文 。 
编写 一 个 解决 回 文 问题 的 递归 方案 ， 你 必须 考虑 的 唯一 问题 是 : 其 简单 情况 是 什么 ? 显 
然 ， 任 何 由 单个 字符 构成 的 字符 串 都 是 一 个 回 文 ， 因 为 颠倒 这 一 字符 串 中 的 字符 对 字符 串 本 
身 没 有 影响 。 因 此 ,单个 字符 的 字符 串 代表 了 一 种 简单 情况 ,但 这 并 不 是 唯一 的 一 种 。 空 串 
(不 包含 任何 字符 的 字符 串 ) 也 是 一 个 回 文 ， 在 这 种 情况 下 ， 任 何 递 归 方 案 也 必须 对 这 种 情 
况 进行 正确 地 操作 。 
图 7-3 包含 了 函数 isPalindrome 的 一 个 递归 实现 ， 如 果 它 的 参数 是 一 个 回 文 ， 则 函 
数 返 回 true。 这 个 函数 首先 检测 参数 字符 串 的 长 度 是 否 小 于 2。 如果 是 ， 则 该 串 一 定 是 一 
个 回 文 。 反 之 ， 函 数 检测 确认 这 个 串 是 否 都 满足 以 上 两 个 必要 条 件 。 
遗憾 的 是 ， 即 使 容易 遵循 这 个 递归 分 解 ， 但 是 图 7-3 展示 的 实现 仍然 是 低 效 的 。 通 过 做 
出 以 下 改变 ， 你 可 以 改进 函数 isPalindrome 的 性 能 : 
e 只 计算 参数 的 长 度 一 次 。 函 数 isPalindrome 原始 的 实现 在 每 次 递归 分 解 层 次 上 
都 计算 了 字符 串 的 长 度 。 只 调用 一 次 length 方法 ， 然 后 通过 递归 调用 链 将 信息 向 
下 传递 ， 这 种 方法 效率 更 高 。 
e 不 要 在 每 次 调用 中 都 生成 一 个 子囊 。 在 isPalindrome 的 第 一 个 版 本 中 ， 其 低 效 
的 原因 是 重复 调用 用 来 删除 首 字 符 和 最 后 一 个 字符 的 substr 函数 。 你 可 以 通过 传 
递 索 引 来 跟踪 预期 的 子 串 开始 和 结束 位 置 ， 从 而 完全 避免 调用 substr. 


/* 

* Function: isPalindrome 

* Usage: if (isPalindrome(str)) . . . 
* 


* Returns true if str is a palindrome, which is a string that 

* reads the same backwards and forwards. This implementation 

* uses the recursive insight that all strings of length O or 1 

* are palindromes and that longer strings are palindromes if 

* their first and last characters match and the remaining substring 


* is a palindrome. 
bal 


bool isPalindrome(string str) { 
int len = str.length(); 
if (len <= 1) { 
return true; 
) eise { 
return str[0] == str[len - 1] && isPalindrome(str.substr(1, len - 2)); 
) 
) 





图 7-3 检查 回 文 的 程序 


上 述 每 一 种 改变 都 要 求 递归 函 数 获取 另外 的 参数 。 图 7-4 展示 了 isPalindrome 的 
一 个 改进 版 本 ， 它 以 一 个 包装 器 函数 实现 ， 该 函数 的 作用 是 调用 辅助 函数 issubstring 
Palindrome 来 实现 所 需 的 工作 。 函 数 isSubstringPalindrome 获取 额外 的 指明 其 应 
检查 的 字符 串 的 始末 索引 位 置 的 参数 pl Al p2。 
/* 


* Function: isPalindrome 
* Usage: if (isPalindrome(str)) . . . 
* 


* Returns true if str is a palindrome, which is a string that reads the 
* same backwards and forwards. This level of the implementation is 
* simply a wrapper for isSubstringPalindrome, which does the real work. 


xy 





图 7-4 isPalindrome 函数 更 高 效 的 实现 
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bool isPalindrome(string str) ( 
return isSubstringPalindrome(str, 0, str.length() - 1); 
) 


/* 

* Function: isSubstringPalindrome 

* Usage: if (isSubstringPalindrome(str, pl, p2)) . . . 
* 


* Returns true if the characters in str from pl to p2, inclusive, form 
* a palindrome. This implementation uses the recursive insight that 

* ali strings of length 0 or 1 are palindromes (the simple cases) and 
* that longer strings are palindromes only if their first and last 

* characters match and the remaining substring is a palindrome. 

ey’ 


bool isSubstringPalindrome(string str, int pl, int p2) ( 
if (pl >= p2) ( 
return true; 
} else ( 
return str[pl] == str[p2] && isSubstringPalindrome(str, pl + 1, p2 - 1); 





图 7-4 (5) 


7.5 二 分 查找 算法 


当 你 处 理 一 系列 存储 在 一 个 矢量 中 的 数值 时 ， 一 个 最 常见 的 操作 就 是 在 这 个 矢量 中 查找 
某 个 特定 的 元 素 。 例 如 ， 如 果 你 经 常 要 处 理 字符 串 矢 量 ， 拥 有 以 下 函数 是 很 有 用 的 : 


int findInVector(string key, Vector<string> & vec); 


该 函数 遍历 vec 中 的 每 一 个 元 素 ， 寻 找 一 个 其 值 等 于 key 的 元 素 。 如 果 找 到 匹配 者 ,fina 
InVector 将 返回 这 个 元 素 的 下 标 索引 。 如 果 该 值 不 存在 ， 则 函数 返回 -1。 

如 果 你 对 这 个 矢量 的 元 素 顺 序 没 有 确切 的 认识 ， 那么 函数 findInVector 的 实现 必 
须 依次 检查 其 中 的 每 个 元 素 ， 直 到 发 现 了 匹配 的 元 素 或 者 遍历 完 所 有 元 素 为 止 。 这 种 策 
略 被 称 为 线性 查找 算法 (linear-search algorithm)， 如 果 矢 量 很 大 ， 那 么 它 会 耗费 大 量 的 时 
间 。 然 而 ， 如 果 你 已 知 矢量 中 的 元 素 是 按 字典 顺序 排列 的 ， 那 么 ， 你 可 以 采取 另 一 种 更 高 
效 的 方法 。 你 需要 将 这 个 矢量 划分 成 两 半 ， 然 后 用 ASCII 字 符 编码 定义 的 被 称 为 字典 顺序 
(lexicographic order) 的 顺序 将 你 正在 试图 查找 的 关键 字 与 最 接近 矢量 中 间 的 那个 元 素 相 比 
较 。 如 果 你 正在 寻找 的 关键 字 在 中 间 元 素 之 前 ， 那 么 这 个 关键 字 (如 果 它 存在 ) 一 定 在 前 半 
部 分 。 相 反 地 ， 在 字典 顺序 中 ， 如 果 关 键 字 在 中 间 元 素 的 后 面 ， 你 需要 在 后 半 部 分 查找 元 
素 。 这 种 策略 被 称 为 二 分 查找 算法 ( binary-search algorithm)。 由 于 二 分 查找 能 够 使 你 在 每 
一 步 查找 的 过 程 中 排除 一 半 的 可 能 元 素 ， 因 此 ， 相 对 于 线性 查找 已 排序 的 矢量 而 言 ， 已 证 明 
它 具 有 更 高 的 效率 。 

图 7-5 所 示 的 二 分 查找 算法 也 是 分 治 策略 的 一 个 完美 实例 。 因 此 ， 二 分 查找 存在 一 个 自 
然 的 递归 实现 并 不 令 人 惊讶 。 注 意 到 函数 findInsortedVvector 是 作为 一 个 包装 器 函数 实 
现 的 ， 它 将 真正 的 工作 留 给 了 递归 函数 binarySearch， 这 个 函数 有 两 个 额外 的 参数 ( 索 
5| p1 和 Pp2 ) 以 限制 查找 的 范围 。 

binarySearch 函数 的 简单 情况 如 下 : 

1. 在 矢量 当前 查找 部 分 中 没有 该 元 素 。 这 个 条 件 被 标记 成 索引 pl 比索 引 p2 大 ， 这 也 
意味 着 没有 剩 下 可 供 查找 的 元 素 。 

2. 中 间 的 元 素 和 查找 的 关键 字 匹 配 。 由 于 这 个 关键 字 刚 好 有 匹配 者 ,findInSsorted 
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Vector 可 以 简单 地 返回 这 个 匹配 元 素 的 索引 。 


Function: findInSortedVector 
Usage: int index - findInSortedVector (key, 


Searches for the specified key in the Vector<string> vec, which 
must be sorted in lexicographic (character code) order If the 
key is found, the function returns the index in the vector at 
which that key appears. (If the key appears more than once in 

the vector, any of the matching indices may be returned). 1f the 
key does not exist in the vector, the function returns -1 This 
implementation is simply a wrapper function; all cf the real work 
is done by the more general binarySearch function 
/ 


* * © = oe O* * o* 


int findInSortedVector(string key, Vector<string> & vec) ( 
return binarySearch(key, vec, 0, vec.size() - 1); 


Function: binarySearch 
Usage: int index - binarySearch(key, vec, 


Searches fór the specified key in the Vector«string» vec, looking 
only at indices between pl and p2, inclusive. The function returns 
* the index of a matching element, or -l if no match is found. 


int binarySearch(string key, Vector<string> & vec, int pl, int p2) ( 
if (pl » p2) return -1; 
int mid = (pl + p2) / 2; 
if (key == vec[mid]) return mid; 
if (key < vec[mid]) ( 
return binarySearch(key, vec, pl, mid - 1); 
) else { 
return binarySearch(key, vec, mid + 1, p2); 
} 
} 





图 7-5 “分 而 治之 ”的 二 分 查找 实现 


如 果 上 述 两 种 情况 都 不 满足 ， 算 法 实现 可 以 将 问题 简化 为 在 矢量 中 挑选 合适 的 一 半 进 行 查 
找 ， 然 后 以 这 个 更 新 后 的 查找 范围 来 递归 地 调用 自己 。 


7.6 间接 递归 


截止 目前 ， 上 述 每 一 个 例子 中 的 递归 函数 都 是 直接 调用 自己 ， 即 函数 体内 包含 一 个 自身 
的 调用 。 尽 管 你 遇 到 的 大 多 数 的 递归 函数 都 可 能 是 这 种 风格 ,但 是 递归 定义 实际 上 要 更 宽泛 
一 些 。 为 了 成 为 一 个 递归 函数 ， 它 必须 在 计算 过 程 中 的 某 一 时 刻 调用 自己 。 如 果 一 个 函数 分 
解 为 若干 子 函 数 ， 那 么 这 个 递归 调用 可 以 发 生 在 更 深层 次 的 艇 套 调用 中 。 例 如 ， 一 个 函数 f 
调用 了 另外 一 个 函数 g， 反 过 来 函数 g 调用 函数 f， 这 种 形式 的 函数 调用 依旧 被 认为 是 递归 
的 。 由 于 函数 f 和 g 彼此 调用 ， 这 种 类 型 的 递归 被 称 为 间接 递归 (mutual recursion) ) 。 

正如 一 个 简单 的 例子 展示 的 一 样 ， 使 用 递归 来 测试 一 个 数字 是 奇数 还 是 偶数 被 证 明 是 
很 简单 的 ， 尽 管 它 非常 低 效 。 例 如 ， 图 7-6 所 示 的 代码 通过 采用 下 面 的 形式 化 定义 实现 了 
isEven fil isOdd AM: 

e 如 果 一 个 数 的 前 趋 是 奇数 ， 则 这 个 数 为 偶数 。 

e 如 果 一 个 数 不 是 偶数 ， 则 它 必 为 奇数 。 

e 数字 0 被 定义 为 偶数 。 
尽管 这 些 规则 看 上 去 很 简单 ， 只 要 数字 是 非 负 的 ， 它 们 形成 了 一 种 有 效 地 区 分 奇数 和 偶数 的 
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策略 基础 。 
图 7-6 中 的 代码 通过 让 函数 isEven fll isodd 获取 的 参数 类 型 为 unsigned 的 方式 确 
保 了 实现 条 件 ，C++ 使 用 unsigned 类 型 表示 不 小 于 0 的 整数 。 


/* 
* Function: isOdd 
* Usage: if (isOdd(n)) . . 
H 


* Returns true if the unsigned number n is odd. A number is odd 
* if it is not even. 


*/ 


bool isOdd (unsigned int n) { 
return !isEven (n); 


} 
/* 


* Function: isEven 
* Usage: if (isEven(n)) . . . 
* 


* Returns true if the unsigned number n is even. A number is even 
* either (1) if it is zero or (2) if its predecessor is odd. 
"7 


bool isEven(unsigned int n) { 
if (n == 0) ( 
return true; 
} eise { 
return isOdd(n - 1); 
) 
) 





Kl 7-6 isEven 和 isodd 的 间接 递归 定义 


7.7 递归 地 思考 


对 于 大 多 数 人 来 说 ， 递 归 不 是 一 个 易于 掌握 的 概念 。 学 习 有 效 地 使 用 递归 需要 大 量 的 练 
J, 并且 它 迫 使 你 用 全 新 的 方法 来 解决 问题 。 成 功 的 关键 在 于 形成 正确 的 习惯 一 一 学 习 如 何 
递归 地 进行 思考 。 本 章 其 余部 分 将 帮助 你 实现 这 个 目标 。 


7.7.1 保持 全 局 的 观点 


当 你 学 习 编 程 时 ， 我 认为 牢记 整体 论 与 简化 论 的 哲学 理念 将 会 对 你 有 很 大 的 帮助 。 简 单 
地 说 ， 简 化 论 (reductionism) 就 是 这 样 一 种 理念 ， 它 仅仅 通过 理解 构成 对 象 的 某 一 部 分 就 
可 理解 整个 对 象 。 与 之 对 立 的 就 是 整体 论 (holism)， 它 认为 整体 总 是 比 构成 它 的 部 分 总 和 更 
为 重要 。 当 你 学 习 编程 时 ， 它 帮助 你 能 够 交错 这 两 种 视角 ， 有 时 候 将 程序 的 行为 当 作 一 个 整 
体 ， 而 在 其 他 时 刻 ， 需 要 探究 执行 的 细节 。 然 而 ， 当 你 试图 理解 递归 时 ， 这 种 平衡 似乎 被 改 
变 了 。 递 归 地 思考 需要 你 从 整体 的 角度 来 思考 。 在 递归 领域 ， 简 化 论 是 理解 的 敌人 ， 它 总 是 
妨碍 你 的 理解 。 

为 了 保持 全 局 的 视角 ， 你 必须 习惯 于 采用 本 章 7.2 节 所 介绍 的 递归 的 稳步 跳跃 的 理念 。 
无 论 你 编写 一 个 递归 程序 或 者 尝试 理解 一 个 递归 程序 的 行为 ， 你 都 必须 找到 在 一 个 单独 的 递 
归 调 用 中 那些 可 以 被 忽略 的 细节 。 只 要 你 选择 了 正确 的 分 解 ， 确 定 了 适当 的 简单 情况 ， 并 且 
正确 地 实现 了 你 的 策略 ， 这 些 递归 调用 将 会 起 作用 ， 你 不 必 考 虑 它们 的 具体 实现 细节 。 

遗憾 的 是 ， 除 非 你 有 大 量 处 理 递 归 函 数 的 经 验 ， 和 否则 有 效 地 运用 递归 的 稳步 跳跃 这 一 概 
念 并 非 易 事 。 采 用 递归 需要 暂缓 你 的 怀疑 ， 并 且 对 程序 的 正确 性 做 出 假设 ， 它 完全 违反 你 以 
往 的 经 验 。 毕 竟 ， 当 你 编写 一 个 程序 时 ， 这 是 很 有 可 能 的 〈 即 使 你 是 一 个 有 经 验 的 程序 员 )， 
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你 的 程序 第 一 次 也 不 会 正确 地 工作 。 事 实 上 ， 很 可 能 是 由 于 你 选择 了 错误 的 分 解 ， 搞 乱 了 简 
单 情况 的 定义 ,或 者 在 你 试图 实现 你 的 策略 时 莫名 其 妙 的 将 事情 弄 得 一 团 糟 。 如 果 你 已 经 做 
了 这 些 事 中 的 任何 一 个 ， 那 么 你 的 递归 调用 将 不 会 工作 。 

当 事 情 出 错时 (由 于 它们 不 可 避免 地 会 发 生 )， 你 必须 牢记 在 合适 的 地 方 寻找 错误 。 问 
题 是 你 在 递归 实现 中 某 个 地 方 发 生 了 错误 ， 不 是 递归 机 制 本 身 有 什么 问题 。 如 果 递 归程 序 有 
问题 ， 你 应 该 能 够 通过 查找 单个 的 递归 层次 来 找到 其 中 的 错误 。 向 下 查找 递归 调用 的 其 他 层 
次 不 会 有 帮助 。 如 果 简 单 情况 能 工作 ， 并 且 递 归 分 解 是 正确 的 ， 那么 子 调用 会 正常 工作 。 否 
则 ， 问 题 一 定 出 现在 递归 分 解 的 公式 中 。 


7.7.2 避免 常见 的 错误 

随 着 你 不 断 地 获得 递归 相关 的 经 验 ， 编 写 和 调试 递归 程序 将 会 变 得 更 自然 。 然 而 ， 刚 开 
始 找 出 你 在 一 个 递归 程序 中 需要 注意 的 东西 是 很 困难 的 。 下 面 是 一 个 清单 ， 它 将 帮助 你 辨别 
最 常见 错误 的 根源 。 

e 你 的 递归 实现 是 以 检查 简单 情况 开始 吗 ? 在 你 尝试 通过 将 一 个 问题 转化 成 一 个 递归 
的 子 问题 的 方式 来 解决 之 前 ， 必 须 先 检查 这 个 问题 是 否 足 够 简单 以 至 于 这 样 的 分 解 
是 不 是 必须 的 。 在 绝 大 多 数 情况 下 ， 递 归 函 数 以 关键 字 if 开始 。 如 果 你 的 函数 不 是 
这 样 ， 应 该 仔细 地 检查 你 的 程序 ， 并 确保 你 知道 自己 正在 做 什么 。 
你 是 否 已 经 正确 地 解决 了 这 些 简单 情况 ?由 于 使 用 错误 的 方法 解决 简单 情况 ， 会 在 
递归 程序 中 产生 令 人 惊讶 的 错误 数量 。 如 果 简 单 情况 是 错误 的 ， 更 复杂 问题 的 递归 
方案 将 会 继承 同样 的 错误 。 例 如 ， 如 果 你 错误 地 将 fact (0) 定义 成 0 而 不 是 1， 
用 任何 参数 调用 fact 都 将 返回 0。 
你 的 递归 分 解 让 问题 变 简单 了 吗 ? 对 于 能 正确 运行 的 递归 ， 求 解 问题 会 变 得 越 来 越 
简单 。 更 正式 地 讲 ， 这 里 一 定 有 某 种 度量 标准 ( metric) (一 种 根据 问题 的 难度 从 而 给 
该 问题 赋 一 个 整数 值 的 标准 的 测量 方法 ) 其 值 会 随 着 计算 过 程 的 进行 而 逐渐 地 变 小 。 
对 于 像 fact 以 及 tib 这 样 的 数学 函数 来 说 ， 以 整 型 参数 值 作 为 度量 标准 。 在 每 一 次 
递归 调用 中 ， 参 数值 都 将 变 小 。 对 于 函数 isPalindrome 来 说 ， 由 于 字符 串 在 每 一 
次 调用 中 都 不 断 地 变 短 ， 因 此 合适 的 度量 标准 就 是 字符 串 参 数 的 长 度 。 如 果 问 题 实 
例 没 有 变 得 更 简单 ， 分 解 过 程 将 会 不 断 地 产生 越 来 越 多 的 调用 ， 会 产生 类 似 于 死 循 
环 一 样 的 被 称 为 无 穷 递归 (nonterminating recursion) 的 递归 调用 。 
这 些 简单 化 的 处 理 最 终 能 到 达 简 单 情况 吗 ， 或 者 你 遗漏 了 一 些 其 他 的 可 能 性 ? 错误 
的 一 般 根 源 是 ， 对 于 所 有 可 以 作为 递归 分 解 的 结果 情况 中 ， 没 有 包括 简单 情况 测试 。 
例如 ， 在 如 图 7-3 所 示 的 isPalindrome 实现 中 ， 函 数 中 检查 空 字符 以 及 单个 字符 
的 情况 是 非常 重要 的 ， 即 使 用 户 从 来 不 打算 以 空 字 符 串 调用 函数 isPallindrome。 
随 着 递归 分 解 的 进行 ， 字 符 串 参数 在 每 一 层 的 递归 调用 中 都 将 缩短 两 个 字符 。 如 果 
原始 字符 串 参 数 的 长 度 是 偶数 ， 那 么 递归 分 解 永远 不 会 进入 单个 字符 的 情况 。 
你 的 函数 递归 调用 表示 与 原始 问题 的 子 问 题 在 形式 上 是 完全 相同 的 吗 ? 当 你 使 用 递 
归来 分 解 一 个 问题 时 ， 子 问题 和 原 问题 具有 相同 的 形式 是 很 重要 的 。 如 果 分 解 调用 
改变 了 问题 的 本 质 或 者 违背 了 一 个 初始 的 假设 ,那么 整个 过 程 将 会 失败 。 正 如 本 章 
中 的 一 些 示例 所 示 ， 定 义 公有 接口 的 函数 作为 一 个 简单 的 包装 器 函数 是 非常 有 用 的 ， 
它 调用 一 个 更 一 般 的 私有 的 递归 函数 。 由 于 私有 函数 具有 更 一 般 的 形式 ， 因 此 ， 它 


232 57 


地 





通常 更 易于 将 原始 问题 进行 分 解 ， 并 使 得 子 问题 仍 具 有 递归 的 结构 。 

当 你 运用 递归 稳步 跳跃 时 ， 递 归 子 问题 的 求解 是 否 为 原始 问题 提供 了 一 个 完整 的 解 
决 方案 ? 将 一 个 问题 分 解 成 递归 的 子 问 题 只 是 递归 过 程 的 一 部 分 。 一 旦 你 获得 了 这 
些 子 问 题 的 解 ， 你 还 必须 能 够 将 它们 重新 整合 以 形成 问题 的 一 个 完整 解 。 检 查 其 处 
理 过 程 是 否 产生 了 问题 的 真实 解 的 方法 就 是 核查 分 解 ， 这 需要 严谨 地 运用 递归 的 稳 
步 跳 跃 。 检 查 当 前 函数 调用 的 每 一 步 ， 但 假设 每 一 个 递归 调用 都 生成 了 正确 的 答案 。 
如 果 遵 循 这 一 过 程 并 且 产 生 了 正确 的 解 ， 你 的 程序 应 该 能 正常 工作 。 


本 章 小 结 


e 本 章 介绍 了 递归 的 概念 ， 它 是 一 种 强大 的 编程 策略 ， 其 中 ， 复 杂 的 问题 可 以 被 分 解 
成 形式 相同 的 更 简单 的 问题 。 本 章 的 重点 包括 : 

递归 与 逐步 求 精 法 类 似 ， 两 种 策略 都 是 将 一 个 问题 分 解 成 更 易于 处 理 的 简单 问题 。 
递归 的 不 同 之 处 在 于 简单 的 子 问题 必须 和 原始 问题 具有 相同 的 形式 。 

为 了 使 用 递归 ， 你 必须 能 够 确定 问题 解 的 简单 情况 ， 以 及 允许 你 将 任何 复杂 问题 分 
解 成 具有 相同 类 型 的 更 简单 问题 的 递归 分 解 。 

采用 C++， 递 归 函 数 通常 都 有 以 下 范例 形式 GOL): 


if (test for simple case) { 
Compute a simple solution without using recursion. 
} else { 
Break the problem down into subproblems of the same form. 
Solve each of the subproblems by calling this function recursively, 
Reassemble the subproblem solutions into a solution for the whole. 


} 


和 其 他 任何 函数 调用 一 样 ， 递 归 函 数 也 是 使 用 完全 相同 的 机 制 实现 的 。 每 次 调用 都 
创建 了 一 个 新 的 包含 了 调用 中 的 局 部 变量 的 栈 帧 。 由 于 计算 机 为 每 一 次 函数 调用 创 
建 了 一 个 单独 的 新 栈 帧 ， 因 此 每 一 层 递 归 分 解 的 局 部 变量 都 是 相互 独立 。 
在 你 能 够 有 效 地 使 用 递归 之 前 ， 必 须 学 会 将 你 的 分 析 限 定 在 递归 分 解 的 一 个 单独 的 
层次 上 ， 并 且 在 没有 跟踪 整个 计算 过 程 的 前 提 下 确保 所 有 更 简单 的 递归 调用 的 正确 
性 。 相 信 这 些 更 简单 的 调用 能 够 正确 地 工作 被 称 为 递归 的 稳步 跳跃 。 
数学 函数 经 常用 递归 关系 的 形式 来 表达 它们 的 递归 性 质 ， 其 中 ， 一 个 序列 中 的 每 个 
元 素 都 根据 它 前 面 的 元 素 定义 。 
即使 蘑 些 递归 函数 可 能 与 它们 对 应 的 迭代 表示 相 比 效率 更 低 ,但 是 递归 本 身 并 没有 
问题 。 和 所 有 典型 的 各 类 算法 一 样 ， 某 些 递 归 策略 要 比 其 他 策略 更 为 有 效 。 
为 了 确保 一 个 递归 分 解 产 生 的 子 问 题 与 原 问题 具有 相同 的 形式 ,经 常 有 必要 使 问题 
一 般 化 。 因 此 ， 采 用 一 种 简单 的 包装 器 函数 实现 一 个 特定 问题 的 求解 方案 通常 是 非 
常 有 用 的 ， 包 装 器 函数 的 唯一 目的 是 调用 一 个 辅助 函数 处 理 更 一 般 的 情况 。 

e 递归 不 一 定 由 一 个 调用 自身 的 函数 组 成 ， 它 可 能 涉及 几 个 在 一 个 循环 模式 中 彼此 调 

用 的 函数 。 涉 及 不 止 一 个 函数 的 递归 被 称 为 间接 递归 。 

© 如 果 你 能 保持 全 局 的 观点 而 非 简化 的 视角 ， 那 么 你 会 在 理解 递归 程序 上 更 加 成 功 。 

以 正确 的 方式 思考 递归 问题 并 非 易 事 。 学 习 有 效 地 使 用 递归 需要 不 断 地 练习 。 对 于 大 多 
数学 生 而 言 ， 掌 握 递归 的 概念 就 要 花费 数 年 。 但 是 ， 由 于 递归 将 会 成 为 你 编程 技能 中 最 强大 
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的 技术 之 一 ， 因 此 值得 花费 时 间 去 学 习 。 341 


复习 题 

.定义 术语 递归 和 和 迭代。 一 个 函数 可 以 同时 使 用 这 两 种 策略 实现 吗 ? 

2. 递归 和 传统 的 逐步 求 精 法 根本 的 不 同 之 处 是 什么 ? 

3. 在 函数 collectContributions 的 伪 码 中 ，if 语句 如 下 所 示 : 
if (n <= 100) 


使 用 <= 操作 符 代替 简单 地 检查 n 是 否 等 于 100 为 什么 很 重要 ? 

. 标准 的 递归 范 型 是 什么 ? 

. 采用 递归 来 有 效 地 求解 一 个 问题 ， 该 问题 必须 拥有 的 两 个 性 质 是 什么 ? 

为 什么 术语 分 而 治之 适用 于 递归 技术 ? 

.递归 的 稳步 跳跃 的 含义 是 什么 ?作为 一 个 程序 员 ， 这 个 概念 对 你 为 什么 很 重要 ? 

.7.2.2 节 给 出 了 很 长 的 一 段 分 析 来 说 明 当 fact (4) 被 调用 时 内 部 发 生 了 什么 。 采 用 这 节 作 为 模型 ， 

跟踪 fib (3) 的 执行 过 程 ， 并 画 出 递归 过 程 中 创建 的 每 一 个 栈 帧 。 

9. 什么 是 递归 关系 ? 

10. 通过 引入 额外 的 规则 ， 即 一 对 兔子 在 生 下 三 对 兔子 之 后 将 会 停止 繁殖 ， 请 修改 斐 波 那 契 兔子 问题 。 
这 个 假设 会 如 何 改变 其 递归 关系 ? 你 需要 在 简单 情况 上 做 出 什么 改变 ? 

11. 当 使 用 图 7-1 给 出 的 递归 实现 来 计算 fib (n) 时 ，fib (1) 被 调用 了 多 少 次 ? 

12. 什么 是 包装 器 函数 ?为 什么 在 编写 递归 卫 数 时 ， 它 经 常 很 有 用 ? 342 

13. 如 果 你 在 函数 additiveSequence 中 删除 了 if (n==1) 的 检测 语句 ， 将 会 发 生 什么 ?其实 现代 
码 如 下 所 示 : 


— 


int additiveSequence(int n, int t0, int tl) ( 
if (n == 0) return t0; 
return additiveSequence(n - 1, tl, tO + t1); 
) 


这 个 函数 还 能 工作 吗 ? 为 什么 能 或 者 不 能 ? 

14. 为 什么 在 图 7-3 中 函数 isPalindrome 的 实现 对 空 串 以 及 单个 字符 的 字符 串 的 检查 是 很 重要 的 ? 
如 果 这 个 函数 不 检查 单个 字符 的 情况 ， 取 而 代 之 的 是 只 检查 字符 串 的 长 度 是 否 为 0， 将 会 发 生 什 
A? 这 个 函数 还 能 正确 地 工作 吗 ? 

15. 解释 图 7-4 给 出 的 isPalindrome 实现 中 的 以 下 捕 数 调用 结果 : 


isPalindrome(str, pl + 1, p2 - 1) 


16. 什么 是 间接 递归 ? 
17. 如 果 像 下 面 一 样 定义 isEven 和 isodd， 将 会 发 生 什么 : 
bool isEven(unsigned int n) ( 


return !isOdd(n); 


) 


bool isOdd(unsigned int n) ( 
return 'isEven (n): 


) 


这 个 例子 说 明了 7.7.2 节 中 的 哪 一 种 错误 ? 
18. 下 面 关 于 isEven 和 isodd 的 定义 也 是 不 正确 的 : 
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bool isEven(unsigned int n) ( 


if (n == 0) ( 
return true; 
) eise ( 


return isOdd(n - 1); 
) < 
} 
bool isodd (unsigned int n) { 
if (n == 1) { 
return true; 
} else { 
return isEven(n - 1); 
} 
} 


给 出 一 个 例子 ， 展 示 这 个 实现 是 怎么 失效 的 ? 这 里 展示 的 常见 错误 是 什么 ? 


习题 

1. 球体 (例如 炮弹 ) 可 以 被 堆 释 形成 一 个 项 上 只 有 一 个 炮弹 的 金字 塔 ， 这 个 炮弹 坐落 在 一 个 由 四 个 炮 
弹 组 成 的 正方 形 上 ， 这 四 个 炮弹 又 坐落 在 一 个 由 九 个 炮弹 组 成 的 正方 形 上 ， 依 此 类 推 。 编 写 一 个 递 
归 函 数 cannonbal1， 这 个 函数 以 一 个 金字 塔 的 高 度 作为 参数 ， 并 返回 这 个 金字 塔 所 包含 的 炮弹 的 
总 数 。 你 的 函数 必须 递归 地 操作 ， 并 且 不 允许 使 用 任何 迭代 的 结构 ， 例 如 while 和 for. 

2. 和 许多 编程 语言 不 一 样 ，C++ 并 不 包含 一 个 预定 义 的 求 寡 操 作 符 。 作 为 对 于 这 个 缺陷 的 一 个 补救 ， 
函数 


int raiseToPower(int n, int k) 


的 递归 的 实现 使 它 能 够 计算 nw*。 你 需 将 求解 这 个 具有 以 下 数学 性 质 的 问题 进行 递归 函数 的 实现 。 


1 车 k 为 0 
nt = 
nx gp! 其 他 


3. 在 18 世纪 ， 天 文学 家 尤 翰 . 丹尼尔 : 提 丢 斯 (Johann Daniel Titius) 为 了 计算 太阳 与 当时 已 知 的 每 
一 个 星球 之 间 的 距离 制定 了 一 个 规则 ， 这 个 规则 后 来 被 约翰 ' 埃 勒 特 : 波 得 (Johann Elert Bode) ic 
载 下 来 。 为 了 运用 这 个 规则 ， 即 著名 的 提 丢 斯 - 波 得 定律 (Titius-Bode Law)， 你 可 以 通过 书写 以 下 
序列 开始 : 





bi=1 b=3 b=6 b=]12 bs=24 bec=48 
其 中 ， 序 列 中 的 每 个 其 后 的 元 素 都 是 其 前 一 个 元 素 的 两 倍 。 运 用 以 下 公式 ， 我 们 可 以 计算 出 这 个 序 
列 中 第 i 个 星球 到 太阳 的 大 致 距离 : 
d; = a 
距离 d, 被 表示 成 天 文 单位 (AU)， 它 相当 于 地 球 到 太阳 的 平均 距离 (大 约 是 93 000 000 英里 )。 除 了 
火星 和 木星 之 间 有 一 个 空缺 ， 提 丢 斯 - 波 得 定律 在 当时 给 出 了 已 知 的 七 个 星球 与 太阳 之 间 的 合理 的 
大 致 距 离 : 





Mercury 0.5AU 
Venus 0.7AU 
Earth 1.0AU 


Mars 1.6AU 


> 


QN UA 


N 


æ 
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Ej 2.8AU 
Jupiter 5.2AU 
Saturn 10.0AU 
Uranus 19.6AU 


天 文学 家 对 序列 中 出 现 的 空缺 的 关注 ， 导 致 发 现 了 小 行星 带 ， 这 预示 了 这 个 小 行星 带 可 能 是 在 很 久 
之 前 太阳 的 卫星 之 一 的 行星 的 残 通 。 

编写 一 个 计算 太阳 和 第 Kk 个 星球 之 间 的 距离 的 递归 函数 getTitiusBodeDistance (k) ， 将 水 星 
编号 为 1， 并且 向 外 逐渐 编号 。 编 写 一 个 测试 函数 ， 并 用 表格 形式 展示 这 些 星球 到 太阳 的 距离 。 

两 个 非 负 整数 的 最 大 公约 数 (经 常 被 简写 成 ged) 就 是 能 被 这 两 个 数 整 除 的 最 大 整数 。 在 公元 前 3 t 
£u, 希腊 数学 家 欧 几 里 得 发 现 x 和 y 的 最 大 公约 数 总 是 可 以 像 下 面 这 样 计算 ; 

e 若 x 能 够 整除 y， 那 么 y 就 是 最 大 公约 数 。 

e 否则 ，x My 的 最 大 公约 数 总 是 等 于 y 和 x 除 以 y 之 后 所 得 的 余数 的 最 大 公约 数 。 

使 用 欧 几 里 得 理论 编写 一 个 计算 x 和 y 的 最 大 公约 数 的 递归 函数 aed (x, y)o 


. 编写 一 个 关于 函数 fib (n) 迭代 的 实现 。 
.对 于 本 章 中 出 现 的 函数 fib (n) 的 两 个 递归 实现 版 本 ， 编 写 一 个 递归 函数 (你 可 以 调用 两 个 函数 


countFibl 和 countEib2 )， 在 相应 的 Fibonacci 计算 过 程 中 计算 函数 调用 的 次 数 。 编 写 一 个 
主 程序 ， 要 求 它 使 用 这 些 函 数 展示 一 个 表格 ， 其 内 容 为 在 n 取 不 同 值 时 ， 每 一 个 算法 的 函数 调用 次 
数 ， 程 序 运 行 结果 如 下 图 所 示 : 


Ci BU nN ESAE ER AET OAE MA EE TAN 


0 
am counts the number of calls made by the two 


This progr 
algorithms used to compute the Fibonacci sequence. 





n fibl  fib2 
0 1 2 
1 1 2 
2 3 3 
3 5 4 
4 9 5 
5 15 6 | 
6 25 7 I 
Ei 41 8 t 
8 67 9 i 
9 109 10 

10 177 11 

11 287 12 hu 





ee aen 





. 编写 一 个 递归 函数 aigitSum(n) ， 它 的 参数 为 一 个 非 负 的 整数 ， 并 且 返 回 它 的 各 位 数字 之 和 。 例 


如 ， 调 用 digitsum(1729) 应 该 返回 1 十 7 十 2 十 9， 也 就 是 19。 
digitSum 的 递归 实现 依赖 于 这 样 一 个 事实 ， 即 非常 容易 通过 除 以 10 的 方式 来 将 一 个 整数 分 
成 两 部 分 。 例 如 ， 给 出 整数 1729， 你 可 以 如 下 图 所 示 将 其 分 解 成 两 部 分 : 
1729 


172 9 


结果 中 的 每 一 个 整数 都 比 原来 的 整数 要 小 ， 因 此 ， 它 代表 了 一 种 更 简单 的 情况 。 

一 个 整数 n 的 数 根 (digit root) 被 定义 为 : 重复 地 将 其 各 位 数 相 加 直到 保留 最 终 的 单个 数字 。 例 如 ， 
1729 可 以 用 下 面 的 步骤 来 计算 它 的 数 根 : 

步骤 1: 1 十 7 十 2 十 9 一 19 

步骤 2: 1 十 9 一 10 

步骤 3: 1 十 0 一 1 
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由 于 在 步骤 3 执行 后 得 到 的 是 单个 数字 1， 故 这 个 值 就 是 数 根 。 
编写 一 个 返回 其 参数 数 根 的 函数 aigitalRoot (n) 。 尽 管 很 容易 使 用 习题 7 中 的 digitsum 
函数 和 一 个 while 循环 来 实现 digitalRoot, 但 编写 一 个 不 直接 使 用 任何 循环 结构 的 递归 函数 也 
是 这 个 问题 的 一 部 分 挑战 。 
9. 正如 你 在 第 2 章 中 所 了 解 到 的 ， 数 学 组 合 函 数 cl, k) 通常 被 定义 为 阶乘 的 形式 ， 如 下 所 示 : 


n! 
k!x (n — k)! 


c(n, k) 的 值 也 可 以 按照 几何 学 的 方式 排列 形成 一 个 三 角形 ， 在 这 个 三 角形 中 ， 随 着 向 三 角形 的 底 
移动 ，n 的 值 增加 ; 从 左 向 右 移动 ，k 的 值 增加 。 最 终 的 结构 以 法 国 数学 家 布 莱 士 : 帕 斯 尔 (Blaise 
Pascal) 命名 ， 被 称 为 帕斯卡 三 角形 (Pascal's Triangle)， 其 排列 如 下 图 所 示 : 
c(0, 0) 
c(1, 0) e(1, 1) 
c(2, 0) 2, 1) c(2, 2) 
c(3, 0) e(3, T) c(3, 2) c(3. 3) 
c(4, 0) c(4, 1) c(4, 2) c(4, 3) c(4, 4) 


帕斯卡 三 角形 有 一 个 有 趣 的 性 质 ， 即 除了 左边 和 右边 的 数字 之 外 ( 值 为 1 )， 其 他 数字 都 是 其 上 面 两 
个 数字 之 和 。 例 如 ， 如 以 下 帕斯卡 三 角形 中 图 出 的 数字 所 示 : 


e(n, k) = 


rs Wms | 


1 6 (15) 20 i5 6 1 


1 7 201 38 33 25 T7 | 
347 它 对 应 于 6 (6, 2 )， 是 出 现在 这 个 数 上 的 两 个 数 5 和 10 之 和 。 利 用 帕斯卡 三 角形 中 数字 间 的 关系 ， 编 
写 一 个 函数 c (n,k) 的 递归 实现 ， 要求 这 个 函数 不 使 用 循环 ， 不 使 用 乘法 运算 以 及 不 调用 fact 函数 。 
10. 编写 以 一 个 字符 串 作 为 参数 的 函数 ， 要 求 函 数 返回 这 个 字符 串 的 逆序 字符 串 。 这 个 函数 的 原型 为 : 
string reverse(string str); l 
语句 
cout «« reverse("program") «« endl; 


应 该 显示 如 下 结果 : 





— $8 d 


你 的 解决 方案 应 该 是 完全 递归 的 ， 并 且 它 不 应 该 使 用 任何 迭代 结构 ， 例 如 while 或 者 for. 
ll. stzlib.h 库 包含 了 一 个 明 数 integerToString。 在 不 使 用 流 的 前 提 下 ， 通 过 使 用 习题 8 中 描 
348 述 的 对 一 个 整数 的 递归 分 解 来 重新 实现 这 个 函数 。 
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递归 策略 


未 战 而 庙 算 不 胜 者 ， 得 算 少 也 。 
一 一 孙子 ， 公 元 前 5 世纪 


若 递归 分 解 直 接 从 一 个 数学 定义 中 得 出 ， 正 如 第 7 章 中 的 fact 和 fib 函数， 采用 递归 
并 不 会 特别 困难 。 大 多 数 情况 下 ， 你 可 以 通过 将 合适 的 表达 式 插 入 到 标准 的 递归 范 型 中 ， 将 
数学 定义 直接 转换 成 一 个 递归 实现 。 然 而 ， 当 你 开始 解决 一 些 更 复杂 的 问题 时 ， 情 况 会 发 生 
变化 。 

本 章 将 引入 几 个 编程 问题 ， 它 们 看 起 来 (至 少 在 表面 上 ) 比 第 7 章 的 问题 更 难 。 事 实 上 ， 
如 果 你 尝试 不 采用 递归 来 解决 这 些 问题 ， 而 是 依赖 于 更 熟悉 的 迭代 技术 ， 你 会 发 现 它们 很 
难 。 相 比 之 下 ， 这 些 问 题 都 有 一 个 惊人 简短 递归 的 求解 方案 。 如 果 你 发 挥 递归 的 威力 ， 对 于 
每 个 问题 只 需要 几 行 代码 就 足够 了 。 

然而 ， 这 些 解 决 方案 的 简洁 性 赋予 了 它们 一 种 假象 ， 即 问题 简单 。 解 决 问题 困难 部 
分 与 代码 的 长 度 毫 不 相关 。 编 写 这 些 程序 的 困难 点 在 于 : 首先 要 找到 递归 分 解 的 办 法 。 
有 时 这 样 做 需要 一 些 巧妙 的 思维 ， 但 是 你 真正 需要 的 是 信心 。 你 必须 接受 递归 的 稳步 
BEEK 


8.1 DORIS 


本 章 的 第 一 个 例子 是 一 个 简单 的 这 题 ， 即 广为人知 的 汉 庶 塔 ( Towers of Hanoi) 问 
题 。 这 个 谜 题 是 由 法 国 数学 家 爱德华 . 卢 卡 斯 在 1880 年 提出 的 ， 汉 诺 塔 问题 迅速 在 
欧洲 流行 。 它 的 成 功 部 分 归功 于 围绕 这 一 这 题 的 逐渐 增长 的 传奇 ， 它 在 法 国 数学 家 享 
All + 7% + Ef (Henri de Parville) 所 著 的 《自然 之 这 》(Za Nature) Ci cg LE B BH 
PE) 中 描述 如 下 : 

在 世界 中 心 贝 拿 勒 斯 圆 顶 之 下 的 一 座 圣 庙 里 ， 放 置 了 一 个 黄 铜板 ， 有 三 根 宝石 

针 固定 在 上 面 ,每 一 根 针 都 有 一 肘 高 ， 厚 度 和 一 个 蜜蜂 的 身体 一 样 。 创 建 世界 时 ， 

林 天 在 其 中 一 根 针 上 面 放 了 64 个 纯 金 圆 盘 ， 最 大 的 金 圆 盘 放 在 铜板 上 ， 其 他 的 金 

圆 盘 随 着 高 度 升 高 ， 越 来 越 小 ， 最 上 面 的 一 个 是 最 小 的 一 个 。 这 就 是 林 天 寺 之 塔 。 

怪 夜 不 断 ， 牧 师 将 金 圆 盘 从 一 根室 石 针 移动 到 另 一 根 上 ， 根 据 楚 天 寺 固 定 不 变 的 法 

则 ， 它 要 求 牧师 的 职责 是 每 次 移动 的 金 圆 盘 数 不 能 超过 一 个 ， 他 必须 把 这 个 金 圆 盘 

放 在 一 根 针 上 ， 并 且 在 这 个 金 圆 盘 下 面 没 有 更 小 的 金 圆 盘 。 当 所 有 的 金 圆 盘 都 从 相 

天 穿 好 的 那 根 针 上 移 到 另外 一 根 针 上 时 ， 世 界 将 在 一 声 震 需 中 毁灭 ， 而 梵 塔 、 店 字 

和 众生 也 都 将 同归于尽 。 
很 多 年 过 去 了 ,环境 已 经 从 印度 转移 到 越南 ， 但 问题 及 其 说 明 仍 保持 不 变 。 

据 我 所 知 ， 汉 诺 塔 迹 题 除了 向 学 计算 机 科学 的 学 生 教授 递归 之 外 ， 并 没有 实际 作用 。 在 
那个 领域 ， 它 有 巨大 的 价值 ， 因 为 解决 方法 只 涉及 递归 。 和 大 部 分 对 应 于 现实 世界 问题 的 递 
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归 算 法 相 比 ， 汉 诺 塔 问题 没有 额外 的 复杂 之 处 ， 和 否则 可 能 会 干扰 你 对 问题 的 理解 ， 并 使 你 不 
明白 递归 方案 是 如 何 解 决 问题 的 。 因 为 作为 一 个 例子 ， 它 能 很 好 地 解决 问题 ， 汉 诺 塔 已 经 包 
含 在 大 部 分 处 理 递归 的 教科 书 中 ， 并 且 它 已 经 成 为 URE 1 章 的 “hello,world” 程 序 ) 计算 
机 科学 家 共同 分 享 的 文化 遗产 中 的 一 部 分 。 

在 这 个 问题 的 商业 版 本 中 ，64 个 传奇 的 金 圆 盘 被 奉 换 成 8 个 木质 的 或 塑料 的 圆 盘 ， 这 
使 得 问题 更 易于 解决 (而 不 是 说 成 本 更 低 )。 问 题 的 初始 状态 看 起 来 如 下 图 所 示 : 





A B C 
一 开始 ，8 个 圆 盘 都 在 塔 柱 A 上 ， 你 的 目的 是 将 这 8 个 圆 盘 从 塔 柱 A 移 到 塔 柱 B， 同 时 要 遵 
循 以 下 规则 : 
e 每 次 只 能 移动 一 个 圆 盘 。 
© 不 人 允许 将 一 个 大 圆 盘 移动 到 小 圆 盘 之 上 。 


8.1.1 问题 框架 

为 了 将 递归 应 用 到 汉 诺 塔 问题 ， 你 必须 首先 在 更 一 般 的 条 件 下 和 弄 清 楚 问 题 的 框 损 。 尽 管 
最 终 的 目的 是 将 所 有 的 圆 盘 从 A 移 到 B， 问 题 的 递归 分 解 涉 及 在 各 种 结构 下 将 更 小 的 圆 盘 
子 塔 从 一 个 塔 柱 移 到 另 一 个 塔 柱 。 在 更 一 般 的 情况 下 ， 你 需要 解决 的 问题 是 将 一 个 给 定 高 度 
的 塔 从 一 个 塔 柱 移 到 另 一 个 塔 柱 ， 使 用 第 三 个 塔 柱 作 为 一 个 临时 仓库 。 为 了 确保 所 有 的 子 问 
题 适 合 于 原始 的 形式 ， 因 此 ， 你 的 递归 程序 必须 包含 以 下 参数 : 

1. 需要 移动 的 圆 盘 数 目 。 

2. 所 有 圆 盘 开 始 所 在 的 塔 柱 名 字 。 

3. 所 有 圆 盘 最 终 应 该 放置 的 塔 柱 名 字 。 

4. 用 于 临时 存储 圆 盘 的 塔 柱 名 字 。 
需要 移动 的 圆 盘 数目 显然 是 一 个 整数 ， 使 用 char 类 型 表示 被 标记 为 A、B 和 C 的 塔 柱 ， 表 
明 此 时 哪 一 个 塔 柱 将 被 涉及 。 了 解 类 型 使 你 可 以 为 移动 塔 这 个 操作 编写 一 个 函数 原型 ， 如 下 
所 示 : 

void moveTower(int n, char start, char finish, char tmp); 
为 了 移动 例子 中 的 8 个 圆 盘 ， 初 始 调用 为 : 

moveTower(8, 'A', 'B', 'C'); 
该 函数 调用 对 应 于 英文 指令 “ Move atower of size 8 from spire A to spire B using spire C as a 
temporary.” 随 着 递归 分 解 的 逐步 进行 ,moveTowez 将 会 以 不 同 的 参数 形式 被 调用 ， 它 以 
不 同 的 配置 移动 更 小 的 塔 。 
8.1.2. 找到 一 种 递归 策略 

既然 你 已 经 有 了 对 这 个 问题 更 一 般 的 定义 ， 那 么 就 可 以 转 到 寻找 某 种 策略 以 移动 一 个 大 
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塔 这 一 问题 上 来 。 为 了 应 用 递归 ， 你 必须 首先 确保 问题 满足 以 下 条 件 : 

1. 必然 存在 一 种 简单 的 情况 。 在 这 个 问题 中 ,pn 等 于 1 即 为 简单 情况 ， 这 意味 着 只 有 一 
个 圆 盘 需要 移动 。 只 要 你 没有 违反 将 一 个 大 的 圆 盘 放 在 小 的 圆 盘 之 上 这 一 规则 ， 你 就 可 以 用 
一 步 操作 移动 一 个 圆 盘 。 

2. 必然 存在 递归 分 解 。 为 了 实现 一 个 递归 求解 ， 必 须 可 以 将 原 问题 分 解 成 与 原 问 题 具 有 
同样 形式 的 更 简单 的 问题 。 递 归 分 解 这 部 分 更 难 ， 并 且 需 要 仔细 检查 。 

为 了 和 弄 明 白 如 何 通过 解决 一 个 更 简单 的 子 问题 帮助 解决 一 个 大 的 问题 ， 需 要 回 过 头 来 考 
虑 原来 有 8 个 圆 盘 的 例子 





A B C 

这 个 问题 的 目的 是 将 8 个 圆 盘 从 塔 柱 A 移 到 塔 柱 B。 你 需要 自问 一 下 : 如 果 你 能 解决 具 
有 更 小 数目 的 圆 盘 的 同样 问题 ， 这 对 你 解决 原 问 题 有 什么 帮助 。 特 别 是 ， 你 应 该 思考 一 下 ， 
能 够 解决 7 个 圆 盘 的 问题 怎么 能 帮助 你 解决 8 个 圆 盘 的 情况 。 

如 果 你 思考 这 个 问题 一 段 时 间 ， 问 题 求 解 思路 便 会 逐渐 清晰 : 可 以 将 问题 分 成 以 下 三 个 
步骤 来 进行 求解 : 

LEO TEXSEE A. 上 面 的 7 个 圆 盘 全 部 移 到 塔 柱 C。 

2. 将 塔 柱 A 最 底下 的 一 个 圆 盘 移 到 塔 柱 Bo 

3. 将 塔 柱 C 上 的 7 个 圆 盘 移 到 塔 柱 B。 
执行 第 一 步 后 ， 你 会 看 到 下 面 圆 盘 所 处 的 位 置 ; 


A B C 


一 旦 你 移 除 了 最 大 圆 盘 上 面 的 7 个 圆 盘 ， 第 二 步 就 是 简单 地 将 该 圆 盘 从 塔 柱 A 移 到 塔 柱 B， 
这 将 会 产生 以 下 的 结构 : 


A B G 


剩 下 的 问题 就 是 将 7 个 圆 盘 从 塔 柱 C 移 到 塔 柱 B， 这 又 再 次 成 为 原形 式 的 一 个 更 小 的 问题 。 
这 个 操作 是 上 述 递归 策略 中 的 第 三 个 步 聚 ， 它 使 问题 达到 最 终 我 们 所 期 望 的 结果 : 
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A B C 
就 是 它 ! 你 完成 了 。 你 已 经 将 移动 8 个 圆 盘 的 塔 问题 降低 到 移动 7 个 圆 盘 的 塔 问题 。 更 
重要 的 是 ， 这 个 递归 策略 可 以 推广 到 以 下 N 个 圆 盘 的 塔 问题 : 
1. 将 最 上 面 的 N 一 1 个 圆 盘 从 开始 所 在 的 塔 柱 移动 到 临时 塔 柱 上 。 
2. 将 最 底下 单独 的 一 个 圆 盘 从 开始 所 在 的 塔 柱 移 到 最 终 所 在 的 塔 柱 上 。 
3. 将 N 一 1 个 圆 盘 从 临时 塔 柱 上 移 回 到 最 终 所 在 的 塔 柱 上 。 
此 刻 ， 很 难 避 免 对 自己 说 :“ 好 ， 我 可 以 将 问题 降 到 只 移动 N 一 1 个 圆 盘 的 塔 ， 但 是 我 
如 何 完 成 它 ?” 训 无 疑问 ， 答 案 是 你 使 用 同样 的 方法 来 移动 N 一 1 个 圆 盘 的 塔 。 你 将 这 个 问 
题 分 解 成 只 需要 移动 N 一 2 个 圆 盘 的 塔 ， 这 个 问题 随后 分 解 成 只 需要 移动 N 一 3 个 圆 盘 的 塔 ， 
依 此 类 推 ， 一 直 持 续 到 只 需 移动 一 个 圆 盘 为 止 。 然 而 ， 从 心理 学 上 讲 ， 最 重要 的 是 避免 一 次 
性 询问 所 有 的 问题 。 递 归 的 稳步 跳跃 应 该 已 经 足够 了 。 你 已 经 在 不 改变 问题 本 身 形式 的 情况 
下 ， 将 它 的 规模 减 小 了 。 这 是 一 项 艰难 的 工作 。 接 下 来 就 是 记 流 水 账 ， 这 些 最 好 让 计算 机 去 
处 理 。 
一 旦 你 已 经 确定 了 简单 情况 和 递归 分 解 ， 你 所 需要 做 的 就 是 将 它们 整合 成 标准 的 递归 范 
式 ， 这 会 产生 下 面 的 伪 码 程序 : 
void moveTower(int n, char start, char finish, char tmp) ( 
if (n == 1) { 
Move a single disk from start to finish. 
) else ( 
Move a tower of size n - 1 from start fo tmp. 
Move a single disk from start to finish. 
Move a tower of size n - 1 from tmp to finish. 
} 
} 


8.1.3 ”验证 这 个 策略 


尽管 事实 上 ， 以 上 的 伪 码 策略 是 正确 的 ， 但 是 问题 推导 到 这 一 步 还 有 些 问题 。 当 你 使 用 
递归 去 分 解 一 个 问题 时 ， 你 必须 确保 新 问题 和 原 问 题 的 形式 相同 。 将 N 一 1 个 圆 盘 从 一 个 塔 
柱 移 到 男 一 个 塔 柱 的 任务 听 起 来 好 像 是 原 问题 的 一 个 实例 ， 并 且 它 适用 于 函数 moveTower 
原型 。 即 使 这 样 ， 仍 有 一 个 微小 但 重要 的 不 同 点 。 在 原 问题 中 ， 目 标 塔 柱 和 临时 塔 柱 都 是 空 
的 。 但 你 移动 N 一 1 个 圆 盘 的 塔 到 临时 塔 柱 作为 递归 策略 的 一 部 分 时 ， 在 开始 所 处 的 塔 柱 上 
剩 下 了 一 个 圆 盘 。 这 个 圆 盘 的 存在 是 否 会 改变 问题 的 性 质 并 因此 证 明 递 归 策 略 是 无 效 的 ? 

为 了 回答 这 个 问题 ， 你 需要 根据 游戏 规则 来 思考 子 问题 。 如 果 递 归 分 解 不 是 以 违反 规则 
结束 的 ， 那 么 一 切 都 好 。 第 一 个 规则 (每 次 只 有 一 个 圆 盘 可 以 被 移动 ) 不 是 问题 。 如 果 不 止 
一 个 圆 盘 ， 递 归 分 解 将 问题 分 解 ， 以 产生 一 个 更 简单 的 问题 。 伪 码 中 实际 移动 圆 盘 的 步骤 只 
能 每 次 移动 一 个 圆 盘 。 第 二 条 规则 〈 不 允许 将 较 大 的 圆 盘 放 在 较 小 的 圆 盘 上 面 ) 是 一 个 关键 
问题 。 你 需要 说 服 自己 : 你 不 会 在 递归 分 解 中 违反 这 条 规则 。 
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一 个 重要 的 观察 结果 是 : 当 你 将 子 塔 从 一 个 塔 柱 移 到 另 一 个 塔 柱 时 ， 你 遗留 在 原来 塔 柱 
的 圆 盘 (在 操作 之 前 的 任何 阶段 ， 那 些 被 遗留 的 圆 盘 ) 一 定 比 当前 子 塔 中 的 圆 盘 大 。 因 此 ， 
当 你 在 塔 柱 之 间 移 动 这 些 圆 盘 时 ， 它 们 下 面 的 唯一 一 个 圆 盘 尺 寸 一 定 比 它们 大 ， 这 是 与 规则 


8.1.4 编码 方案 


为 了 完成 汉 诺 塔 的 解决 方案 ， 唯 一 的 缺失 步骤 就 是 蔡 换 剩余 伪 码 的 函数 调用 。 移 动 
一 个 完整 的 塔 的 任务 需要 递归 调用 moveTower 函数 。 其 他 唯一 的 操作 就 是 将 一 个 单独 的 
圆 盘 从 一 企 塔 柱 移 到 另 一 个 塔 柱 。 为 了 编写 能 显示 解决 方案 的 各 步骤 的 测试 程序 ， 你 所 需 
做 的 就 是 编写 一 个 将 这 些 操作 输出 在 控制 台 上 的 函数 。 例 如 ， 你 可 以 如 下 所 示 实 现 函 数 


moveSingleDisk: 


void moveSingleDisk(char start, char finish) { 
cout «« start «« " -» " «« finish «« endl; 
) 


moveTower 代码 本 身 如 下 所 示 : 


void moveTower(int n, char start, char finish, char tmp) ( 
if (n == 1) ( 
moveSingleDisk(start, finish); 
) eise ( 
moveTower(n - 1, start, tmp, finish); 
moveSingleDisk(start, finish); 
moveTower(n - 1, tmp, finish, start); 


) 
其 完整 的 实现 显示 在 图 8-1 中 。 


* This program solves the Towers of Hanoi puzzle 
tf 


#include <iostream> 
#include "simpio.h" 
using namespace std; 


/* Function prototypes */ 


void moveTower(int n, char start, char finish, char tmp); 
void moveSingleDisk(char start, char finish); 


/* Main program */ 


int main() ( 
int n = getInteger("Enter number of disks: "); 
moveTower(n, 'A', 'B', 'C'); 
return 0; 


Function: moveTower 
Usage: moveTower(n, start, finish, tmp); 


Moves a tower of size n from the start spire to the finish 
spire using the tmp spire as the temporary repository. 





图 8-1 解决 汉 诺 塔 问题 的 程序 
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void moveTower (int n, char start, char finish, char tmp) ( 
if (n == 1) { 
moveSingleDisk(start, finish) ; 
} else { 
moveTower(n — 1, start, tmp, finish); 
moveSingleDisk(start, finish); 
moveTower(n - 1, tmp, finish, start); 


) 
) 


/* 
* Function: moveSingleDisk 
* Usage: moveSingleDisk(start, finish); 


* Executes the transfer of a single disk from the start spire to the 

* finish spire. In this implementation, the move is simply displayed 
* on the console; in a graphical implementation, the code would update 
* the graphics window to show the new arrangement. 

^j. 


void moveSingleDisk(char start, char finish) ( 
cout << start << " -> " << finish << endl; 


} 





图 8-1 (4) 


8.1.5 跟踪 递归 过 程 

moveTower 实现 的 唯一 问题 是 它 看 起 来 很 不 可 思议 。 如 果 你 像 大 多 数学 生 一 样 第 一 
学 习 递归 ， 这 个 解决 方案 代码 看 起 来 如 此 简短 ， 以 至 于 你 感觉 一 定 有 某 些 东西 被 遗漏 了 。 圆 
盘 塔 的 移动 策略 在 哪里 ? 计算 机 如 何 知 道 首 先 需 要 移动 哪个 圆 盘 ， 它 移动 到 哪里 ? 

答案 正 是 递归 过 程 (将 一 个 问题 分 解 成 相同 形式 的 更 小 的 子 问题 ， 然 后 提供 简单 示例 的 
解决 方法 )， 它 是 你 所 需要 求解 问题 的 根本 。 如 果 你 相信 递归 的 稳步 跳跃 ,你 已 经 完成 任务 
了 。 你 可 以 跳 过 这 一 章节 ， 继 续 阅 读 下 一 章 。 另 一 方面 ， 如 果 你 对 此 仍 有 所 怀疑 ， 你 可 能 就 
需要 浏览 完整 过 程 的 步骤， 看 一 看 发 生 了 什么 。 

为 了 使 问题 更 易于 控制 ， 让 我 们 考虑 一 下 : 如 果 原 来 的 塔 中 只 有 3 个 圆 盘 会 发 生 什么 。 
因此 ， 主 程序 的 调用 应 该 为 如 下 语句 : 


moveTower(3, 'A', 'B', 'C'); 


为 了 跟踪 这 个 调用 在 移动 3 个 圆 盘 的 塔 所 需 的 计算 步骤， 你 所 需要 做 的 就 是 跟踪 这 个 程序 的 
执行 过 程 ， 这 和 第 7 章 中 阶乘 的 例子 所 使 用 的 策略 完全 相同 。 对 于 每 个 函数 调用 ， 你 可 以 采 
用 一 个 显示 该 调用 参数 值 的 栈 帧 。 例 如 ， 初 始 调用 moveTower 创建 了 以 下 栈 帧 : 


void moveTower(int n, char start, char finish, char tmp) ( 
ew if (n == 1) { 
moveSingleDisk (start, finish) ; 
) else { 
moveTower(n - 1, start, tmp, finish); 


moveSingleDisk (start, finish); 
moveTower(n - 1, tmp, finish, start); 
) 





正如 代码 中 的 箭头 所 示 ， 由 于 该 函数 正 被 调用 ， 因 此 ， 函 数 体 中 第 一 条 语句 开始 执行 。n 的 
当前 值 不 等 于 1， 这 意味 着 程序 向 前 跳 至 else 分 句 并 执行 语句 : 


moveTower(n-1, start, tmp, finish); 
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与 任何 函数 调用 一 样 ， 第 一 步 都 是 计算 参数 。 为 此 ， 你 需要 求 形 参 变量 n、start、tmp 和 
finish 的 值 。 每 当 你 需要 得 到 某 个 变量 的 值 时 ， 你 就 可 以 使 用 当前 栈 帧 所 定义 的 那个 变量 
fü. HE, moveTower 调用 等 价 于 : 


moveTower(2, 'A', 'C', 'B'); 


而 ， 这 个 操作 表明 了 男 一 个 函数 调用 ， 这 意味 着 当前 操作 被 挂 起 ， 直 到 新 的 函数 调 
用 完成 为 止 。 为 了 跟踪 新 函数 调用 的 操作 ， 你 需要 生成 一 个 新 的 栈 帧 并 重复 该 过 程 。 一 如 
既往 ， 新 栈 帧 中 的 参数 以 它们 出 现 的 顺序 从 调用 参数 中 复制 而 来 。 因 此 ， 新 栈 帧 如 下 图 
所 示 : 


void moveTower(int n, char start, char finish, char tmp) { | 
void moveTower(int n, char start, char finish, char tmp) ( 
wif (n == 1) { 
moveSingleDisk (start, finish); 
} else { 


o M - 1, start, tmp, finish); 
moveSingleDisk (start, finish); 
moveTower(n - 1, tmp, finish, start); 


) ) start finish 


Pete te ile) 





如 上 图 所 示 ， 新 栈 帧 有 它 自 己 的 一 组 参数 ， 它 们 临时 取代 了 前 一 个 函数 调用 中 的 参数 。 因 
此 ， 一 且 程 序 执行 到 这 个 栈 帧 ，n 的 值 就 会 变 为 2，start BH'A', finish EN 'C', 
tmp 变 为 'B'。 直 到 对 moveTower 的 调用 所 代表 的 子 任务 完成 ， 上 层 栈 帧 中 的 旧 值 才 会 
出 现 。 

moveTower 的 每 层 递归 调用 的 执行 过 程 都 完全 一 样 。n 再 一 次 不 等 于 1， 这 需要 另 一 
个 调用 : 


moveTower(n-1, start, tmp, finish); 


然而 ， 由 于 这 个 调用 来 自 另 一 个 不 同 的 栈 帧 ， 因 此 各 变量 的 值 便 和 原来 调用 中 的 变量 值 不 
同 。 如 果 你 计算 当前 栈 帧 的 参数 ， 你 会 发 现 这 个 函数 调用 相当 于 以 下 函数 调用 : 


moveTower(l, 'A', 'B', 'C'); 


该 调用 的 效果 是 引入 了 moveTower 函数 调用 的 另外 一 个 栈 帧 ， 如 下 图 所 示 : 





id moveTower(int n, char start, char finish, char tmp) { | 









1| | void moveTower (int Ty char start, char finish, char 
| | eif (n == 1) 
moveSingleDisk (start, finish); 







} eise( 
moveTower(n - 1, start, tmp, finish); 
ater erage finish) ; 
moveTower(n — 1, tmp, finish, start); 









B start finish 


_ Lx ]L JL» jie T] 


然而 ， 这 个 moveTower 调用 的 确 表示 简单 情况 。 因 为 n 等 于 1， 程 序 调 用 move 
SingleDisk 函数 将 一 个 圆 盘 从 A 移 到 B， 其 问题 帧 结构 如 下 : 
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A B C 
此 时 ， 最 近 的 moveTower PBC Hse RFK]. FEW, EMR WA, Jf 
返回 到 刚 执行 完 的 else 语句 后 的 第 一 条 语句 的 栈 帧 ， 如 下 图 所 示 : 


void moveTower(int n, char start, char finish, char tmp) { 


void moveTower(int n, char start, char finish, char tmp) ( 
if (n = 1)( 
moveSingleDisk (start, finish); 
} else { 


moveTower(n - 1, start, tmp, finish); 
ex moveSingleDisk (start, finish); 
moveTower(n — 1, tmp, finish, start); 


n start finish Iu 
Ca] 
moveSingleDisk 调用 再 次 代表 一 种 简单 操作 ， 它 使 程序 处 于 以 下 状态 : 





A B E 
随 着 moveSingleDisk 操作 的 完成 ， 完 成 moveTower 调用 的 唯一 步骤 是 在 函数 中 执 
行 最 后 一 条 语句 : 
moveTower(n-1, tmp, finish, start); 


对 当前 栈 帧 中 的 参数 进行 计算 后 ， 上 述 函 数 调用 等 价 于 如 下 语句 : 


moveTower(1, 'B', 'C', 'A'); 


这 个 函数 调用 需要 创建 一 个 新 栈 帧 。 然 而 ， 此 时 你 应 该 能 明白 : 该 函数 调用 的 结果 就 是 利用 
塔 柱 A 作为 一 个 临时 仓库 ， 将 1 个 圆 盘 的 塔 从 塔 柱 B 移 到 塔 柱 C。 实 质 上 ， 该 函数 求 出 n 
的 值 为 1， 然后 调用 moveSingleDisk 使 问题 达到 以 下 状态 : 


A B C 
这 个 操作 再 次 完成 了 一 个 moverTower 调用 ， 并 将 结果 返回 给 调用 它 的 子 任务 ， 这 个 子 
任务 将 2 个 圆 盘 的 塔 从 塔 柱 A 移 到 塔 柱 C。 以 上 调用 过 程 丢弃 刚 完 成 的 子 任务 的 栈 帧 ， 从 
而 使 栈 帧 变化 成 以 下 状态 : 


void moveTower(int n, char start, char finish, char tmp) { 
if (n == 1)( 
moveSingleDisk (start, finish); 
} else { 
moveTower(n - 1, start, tmp, finish); 


r moveSingleDisk (start, finish); 
moveTower(n — 1, tmp, finish, start); 


n start finish 
F2] 9 ite) 
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下 一 步 是 调用 movesingleDisk， 将 最 大 的 圆 盘 从 塔 柱 A 移 到 塔 柱 B， 这 导致 了 圆 盘 


的 位 置 如 下 图 所 示 : 
A B G 
剩 下 的 唯一 操作 是 调用 以 下 语句 : 360 


moveTower(n-1, tmp, finish, start); 
该 调用 的 参数 值 来 自 当 前 栈 帧 如 下 所 示 : 


moveTower(2, 'C', 'B', 'A'); 


如 果 你 仍 对 这 个 递归 过 程 有 所 怀疑 ， 你 可 以 画 出 这 个 函数 调用 创建 的 栈 帧 ， 并 持续 跟踪 
它 的 调用 过 程 以 得 出 最 终结 论 。 然 而 ， 在 某 些 地方 ， 你 可 确信 这 个 调用 过 程 ， 并 将 函数 调用 
看 作 是 一 个 单独 的 具有 以 下 英文 指令 作用 的 操作 是 非常 重要 的 ， 该 英文 指令 如 下 : 


Move a tower of size 2 from C to B, using A as a temporary repository. 


如 果 你 用 整体 形式 来 思考 这 一 过 程 ， 马 上 会 发 现 完成 这 步 将 会 使 两 个 圆 盘 从 塔 柱 C 移 到 塔 
柱 B， 导 致 了 我 们 所 期 望 的 结果 : 


| S| 


A B 、 C 


8.2 子 集 求 和 问题 


尽管 汉 诺 塔 问题 精彩 地 展示 了 递归 的 威力 ， 但 作为 一 个 例子 ， 由 于 它 没 有 任何 实际 应 
用 ， 其 效用 受到 了 折 损 。 许 多 人 被 编程 所 吸引 ， 是 因为 编程 能 使 他 们 解决 实际 问题 。 如 果 所 
有 递归 问题 都 像 汉 诺 塔 问题 那样 ， 那 么 很 轻易 就 会 得 出 这 样 一 个 结论 : 即 递归 仅 适 用 于 解决 
抽象 问题 。 实 际 情况 远 非 如 此 。 递 归 策 略 产生 了 对 于 实际 问题 极其 有 效 的 解决 方法 〈 尤 其 是 
第 10 章 介 绍 的 排序 问题 )， 但 用 其 他 方法 却 很 难 解决 。 

本 节 所 涉及 的 问题 被 称 为 子 集 求 和 问题 (subset-sum problem)， 可 定义 如 下 : 

给 定 一 个 整数 集合 和 一 个 目标 值 ， 确 定 是 否 可 以 找到 这 个 整数 集合 的 一 个 子 集 ， 子 集 的 
和 等 于 指定 的 目标 值 。 

例如 ， 给 定 集合 {-2,1,3,8} 和 目标 值 7， 子 集 求 和 问题 的 答案 是 “是 ”， 因 为 子 集 
{-2,1,8} 的 元 素 之 和 等 于 7。 然 而 ， 如 果 目 标 值 是 5， 答 案 将 为 “ 否 ”， 因 为 没有 一 种 方法 能 
选择 出 整数 集合 {-2,1,3,8} 的 一 个 子 集 ， 其 元 素 之 和 为 5。 361 

很 容易 就 能 将 子 集 求 和 问题 的 想法 翻译 成 C++ 语句 。 具 体 的 目标 是 编写 一 个 判定 函数 : 


bool subsetSumExists (Set<int> & set, int target); 


该 函数 获取 所 需要 的 信息 ， 如 果 通 过 相 加 来 自 set 的 某 些 元 素 ， 可 以 产生 值 target， 就 
返回 true。 

尽管 子 集 求 和 问题 可 能 开始 看 起 来 就 像 汉 诺 塔 问题 一 样 难 懂 ， 但 它 在 计算 机 理论 与 实践 
方面 都 非常 重要 。 正 如 你 将 在 第 10 章 所 看 到 的 ， 子 集 求 和 问题 是 一 类 重要 的 计算 问题 中 的 
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一 个 实例 ， 它 难以 有 效 地 被 解决 。 然而， 这 个 事实 使 得 像 子 集 求 和 问题 在 信息 加 密 领 域 的 应 
用 中 非常 有 用 。 例 如 ， 公 钥 密 码 学 的 第 一 种 实现 就 使 用 了 子 集 求 和 问题 的 一 个 变种 来 作为 它 
的 数学 基础 。 现 代 的 加 密 策略 是 通过 将 其 操作 附加 在 一 个 被 证 明 很 难 的 问题 上 ， 采 用 这 样 的 
密码 难以 破解 。 


8.2.1 寻找 一 个 递归 解决 方案 


采用 传统 的 迭代 方法 很 难 求解 子 集 求 和 问题 。 想 要 取得 进展 ， 你 需要 递归 地 思考 问题 。 
因此 ， 一 如 既往 ， 你 需要 确定 一 个 简单 情况 和 递归 分 解 。 在 涉及 集合 的 应 用 中 ， 简 单 情况 往 
往 会 在 集合 为 空 时 发 生 。 如 果 集 合 为 空 ， 没 有 任何 一 种 方法 将 元 素 加 起 来 能 产生 目标 值 ， 除 
非 目 标 值 为 0。 这 个 发 现 暗示 subsetSumExists 的 代码 将 会 像 这 样 开始 : 
bool subsetSumExists (Set<int> & set, int target) { 
if (set.isEmpty()) ( 
return target == 0; 
) else { 
Find a recursive decomposition that simplifies the problem. 
) 
} 


在 这 个 问题 中 ， 困 难 的 部 分 是 找到 递归 分 解 的 方法 。 

当 你 正在 寻找 一 种 递归 分 解 时 ， 你 需要 密切 留意 输入 中 的 某 些 值 (它们 被 转换 成 用 C++ 
表示 的 问题 公式 化 的 参数 )， 你 可 以 使 这 些 参数 变 小 。 对 于 本 问题 的 求解 ， 你 所 需要 做 的 就 
是 使 集合 变 小 ， 因 为 你 尝试 做 的 就 是 向 集合 为 空 时 发 生 的 简单 情况 靠拢 。 如 果 你 从 某 个 集合 
取出 一 个 元 素 ， 则 它 就 少 了 一 个 元 素 ， 集合 变 小 。Set 类 提供 的 操作 能 很 容易 地 从 一 个 集合 
中 选取 一 个 元 素 并 确定 所 剩余 的 元 素 。 你 所 需 的 是 以 下 代码 : 


int element = set.first(); 
Set<int> rest = set - element; 


fizst 方 法 返回 集合 中 按 和 迭代 顺序 排序 的 第 一 个 元 素 ， 上 述 表 达 式 涉及 重 载 - RE, C 
生 了 一 个 包含 set 集合 中 除去 element 值 的 所 有 其 他 元 素 的 集合 6 element 在 迭代 顺序 
中 排 在 第 一 个 的 事实 在 这 里 并 不 重要 。 你 真正 所 需要 的 是 选择 一 个 元 素 ， 然 后 将 你 所 选 的 元 
素 从 原来 的 集合 中 删除 ， 创 建 一 个 更 小 的 集合 。 

然而 ， 使 集合 变 小 是 不 足以 解决 这 个 问题 。 就 结构 而 言 ， 你 知道 subsetSum 
Exists 必须 在 更 小 的 集合 中 递归 地 调用 自己 ,更 小 的 集合 当前 存储 在 变量 rest H, M 
还 不 能 确定 的 是 这 些 递归 的 子 问 题 的 解决 方法 是 如 何 帮助 解决 原 问题 的 。 你 所 需 使 用 的 策 
略 将 在 下 一 节 中 描述 ， 并 且 将 展示 一 个 通用 的 编程 模式 ， 它 已 被 证 明 在 很 多 应 用 中 是 有 
用 的 。 


8.2.2 包含 /排除 模式 


为 了 完成 subsetSumExists 函数 的 实现 ， 你 所 需 的 关键 的 洞察 力 是 : 在 你 确定 了 一 
个 特定 的 元 素 后 ， 可 以 采用 两 种 方法 产生 期 望 的 目标 和 。 一 种 可 能 是 你 找到 了 包含 该 目标 
元 素 的 子 集 。 既 然 如 此 ， 很 有 可 能 是 取出 集合 中 的 剩余 元 素 并 产生 target-element. 5 
一 种 可 能 是 你 所 寻找 的 子 集 不 包含 目标 元 素 ， 那 么 很 有 可 能 仅 使 用 子 集 剩 余 的 元 素 产 生 值 
target。 对 于 完成 subsetSumExists 函数 的 实现 ， 这 种 洞察 力 已 经 足够 了 。 
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bool subsetSumExists (Set<int> & set, int target) { 
if (set.isEmpty()) { 
return target == 0; 
} else { 
int element = set.first(); 
Set<int> rest = set - element; 
return subsetSumExists(rest, target) 
|| subsetSumExists (rest, target - element) ; 
} 
} 
因为 这 个 递归 策略 将 一 般 情形 细 分 为 两 个 分 支 ， 一 种 包含 特定 的 元 素 ， 另 一 种 不 包含 该 
特定 元 素 ， 这 种 策略 有 时 也 称 为 包含 / 排除 模式 〈inclusion/exclusion pattern). 。 当 你 做 本 章 
后 面 的 习题 时 ， 你 会 发 现 这 种 相同 的 策略 ， 它 可 能 来 自 于 各 种 略微 不 同 的 应 用 问题 。 尽 管 当 
你 处 理 集合 时 ， 这 种 模式 是 最 容易 识别 的 ， 它 也 出 现在 一 些 涉及 矢量 和 字符 串 的 应 用 中 ， 此 
时 ， 你 应 该 格外 留意 它 。 


8.3 字符 排列 


许多 单词 游戏 和 谜 题 需要 能 将 一 组 字母 重新 排列 以 形成 一 个 单词 。 因 此 ， 如 果 你 想 编 写 
一 个 拼 字 游 戏 程序 ， 具有 对 于 一 个 给 定 的 字符 集合 可 以 产生 其 所 有 的 排列 组 合 这 一 机 制 将 会 
是 非常 有 用 的 。 在 单词 游戏 中 ， 这 样 的 排列 一 般 被 称 为 重组 字 (anagram), EAE, CH 
称 为 排列 (permutation ) 。 

假设 你 想 编写 以 下 函数 : 


Set<string> generatePermutations (string str); 


该 函数 返回 一 个 包含 字符 串 所 有 排列 情况 的 集合 。 例 如 ， 如 果 你 调用 以 下 函数 : 


generatePermutations ("ABC") 
应 该 返回 一 个 包含 下 列 元 素 的 集合 : 

( "ABC", "ACB", "BAC", "BCA", "CAB", "CBA" | 

你 如 何 实现 generatePermutations 函数 呢 ? 如 果 你 局 限于 迭代 控制 结构 ， 找 到 一 
个 通用 的 方法 来 处 理 任 意 长 度 的 字符 串 是 困难 的 。 另 一 方面 ， 递 归 地 思考 这 个 问题 将 会 产生 
一 个 相对 简单 的 解决 方案 。 

对 于 递归 程序 而 言 ， 通 常 求解 过 程 中 最 难 的 部 分 是 如 何 将 原 问 题 分 解 成 相同 形式 的 ， 但 
却 更 简单 的 原 问题 的 实例 。 此 时 ， 为 了 产生 字符 串 的 所 有 排列 情况 ， 你 需要 发 现 如 何 能 够 产 
生 一 个 更 短 字符 串 的 所 有 排列 情况 ， 这 可 能 对 于 求解 最 终 的 问题 有 所 帮助 。 

在 你 看 到 后 面 的 解决 方案 之 前 ， 请 停 下 来 思考 这 个 问题 几 分钟 。 当 你 第 一 次 学 习 递 归 
时 ， 很 容易 看 懂 一 个 递归 方案 ， 并 且 你 也 能 自己 实现 这 一 方案 。 然 而 ， 没 有 第 一 次 尝试 ， 你 
很 难 知道 是 否 能 提出 必要 的 递归 策略 。 

考虑 一 个 实例 将 有 助 于 给 你 自己 更 多 的 关于 这 个 问题 的 感受 。 假 设 你 想 产 生 一 个 拥有 5 
个 字符 的 字符 串 的 所 有 排列 情况 ,例如 "ABCDE"。 在 你 的 解决 方案 中 ， 你 可 以 采用 递归 来 
产生 任何 较 短 的 字符 串 的 所 有 排列 情况 。 假 设 递归 调用 起 作用 并 且 可 以 完成 该 任务 。 再 一 次 
强调 : 决定 性 的 问题 是 排列 较 短 的 字符 串 怎 样 能 够 帮助 你 排列 原来 的 5 个 字符 的 字符 串 。 

如 果 你 致力 于 将 5 个 字符 的 字符 串 排 列 问题 分 解 成 若干 4 个 字符 的 字符 串 排列 实例 ， 很 
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快 就 会 发 现 5 个 字符 的 字符 串 "ABCDE" 的 排列 包含 下 面 的 字符 串 : 

e 字符 'A' 后 面 跟着 "BCDE" 的 每 一 种 可 能 的 排列 。 

e 字符 'B' 后 面 跟着 "ACDE" 的 每 一 种 可 能 的 排列 。 

e 字符 'c' 后 面 跟着 "ABDE" 的 每 一 种 可 能 的 排列 。 

e 字符 'D' 后 面 跟着 "ABCE" 的 每 一 种 可 能 的 排列 。 

e 字符 'E' 后 面 跟着 "ABCD" 的 每 一 种 可 能 的 排列 。 

更 宽泛 地 说 ， 你 可 以 通过 顺序 选择 集合 中 的 每 个 字符 ， 构 建 包 含 长 度 为 n 的 字符 串 的 所 有 排 
列 情况 的 集合 ， 首 字母 有 n 种 可 能 性 ， 对 于 其 中 的 每 一 种 可 能 性 ， 将 选择 的 字符 连接 到 剩 下 
的 n 一 1 个 字符 的 每 一 个 可 能 的 排列 的 开头 。 产 生 n 一 1 个 字符 的 所 有 的 排列 情况 是 相同 类 型 
的 更 小 的 问题 ， 因 此 它 可 以 递归 地 解决 。 

一 如 既往 ， 你 也 需要 定义 一 种 简单 情况 。 一 种 可 能 性 是 检测 字符 串 是 否 包 含 一 个 单 
独 的 字符 。 计 算 含 有 1 个 字符 的 字符 串 的 所 有 排列 情况 是 很 容易 的 ， 因 为 它 只 有 一 种 可 能 
的 顺序 。 然 而 ， 在 字符 串 处 理 过 程 中 ， 简 单 情 况 的 最 好 选择 并 不 是 处 理 含 有 1 个 字符 的 字 
符 串 的 情况 ， 因 为 有 一 个 更 简单 的 选择 : 即 不 包含 任何 字符 的 空 字符 串 。 正 如 只 有 1 个 字 
符 的 字符 串 ， 它 只 有 一 种 顺序 ， 也 只 有 一 种 方法 来 书写 空 字 符 串 。 如 果 你 调用 generate 
Permutations ("")， 你 可 以 得 到 一 个 包含 一 个 元 素 的 集合 ， 这 个 元 素 就 是 空 字 符 串 。 

一 旦 你 有 了 简单 情况 和 递归 的 洞察 力 ， 编 写 generatePermutations 函数 的 代码 就 
变 得 相当 简单 。 generatePermutations 函数 的 代码 及 其 简单 的 测试 程序 显示 在 图 8-2 中 ， 

该 测试 程序 要 求 用户 输 入 一 个 字符 串 ， 然 后 它 输出 该 字符 串 中 字符 的 每 一 种 可 能 的 排列 情况 。 


/* 


* File: Permutations.cpp 


* This file generates all permutations of an input string 
*/ 


#include <iostream> 
finclude "set.h" 

finclude "simpio.h" 
using namespace std; 


/* Function prototypes */ 
Set«string» generatePermutations(string str); 
/* Main program */ 


int main() ( 
string str - getLine("Enter a string: "); 
cout << "The permutations of \"" << str << "\" are:" << endl; 
for (string s : gúneratePaimutations {ats} ) { 
cout << " \"" << s << "\"" << endl; 
) 
return 0; 


) 
/* 


* Function: generatePermutations 
* Usage: Set«string» permutations - generatePermutations (str); 
* 


* Returns à set consisting of all permutations of the specified string. 
* This implementation uses the recursive insight that you can generate 
* all permutations of a string by selecting each character in turn, 

* generating all permutations of the string without that character, 

* and then concatenating the selected character on the front of each 

* string generated. 


ay 





图 8-2 产生 一 个 字符 串 所 有 排列 情况 的 程序 
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Set«string» generatePermutations(string str) { 
Set«string» result; 
if (str == "") { 
result += "" 
} else { 
for (int i = 0; i < str.length(); i++) { 
char ch = str[i]; 
string rest = str.substr(0, i) + str.substr(i + 1); 
for (string s : generatePermutations(rest)) { 
result += ch + s; 
} 
} 
} 
return result; 


} 








图 8-2 (5) 366 


如 果 你 运行 Permutations 程序 并 输入 字符 串 "ABC" ， 你 会 看 到 以 下 给 出 : 


Enter a string: ABC 
The permutations of "ABC" are: 
"ABC" 








在 这 个 应 用 中 ， 使 用 集合 确保 了 程序 按照 字母 表 的 顺序 生成 所 有 的 排列 情况 ， 即 使 在 输入 
的 字符 串 中 有 重复 的 字母 ， 每 一 种 不 同 的 字符 顺序 也 只 出 现 一 次 。 例 如 ， 当 你 输入 字符 串 
AABB， 它 仅 生成 下 图 所 示 的 六 种 排列 顺序 : 


Enter a string: AABB 
The permutations of "AABB" are: 
"AABB" 





递归 过 程 中 调用 了 aaa Jrik 24 C4 1 ) 次 , 但 是 Set 类 的 实现 确保 了 不 会 出 现 重复 值 。 
通过 改变 图 8-2 所 示 的 主 程序 ， 你 可 以 使 用 generatePermutations 国 数 来 产生 某 
个 单词 的 所 有 重组 词 ， 以 便 将 每 一 个 字符 串 与 英语 字典 中 的 单词 进行 核对 。 假 如 你 输入 字符 
"aeinrst"， 你 会 得 到 以 下 输出 ， 一 个 认真 的 拼 字 游戏 玩家 可 立刻 识别 的 单词 列表 : 
(600 . . Anagrams 
Enter the letters: aeinrst 
= a of aeinrst are: 


nastier 
ratines 


retains 
retinas 
retsina 
stainer 


stearin 





8.4 图 的 递归 


某 些 最 令 人 兴奋 的 递归 调用 使 用 图 来 创建 复杂 的 图 片 ， 其 中 以 不 同 的 规模 来 重复 一 个 特 
定 的 主题 。 本 章 其 余部 分 提供 了 几 个 关于 图 递归 的 实例 ， 它 们 均 利 用 了 第 2 章 结 尾 简要 介绍 
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过 的 GWindow 类 。 这 些 对 于 学 习 递 归 而 言 并 不 重要 ， 如 果 你 还 没准 备 好 使 用 图 形 库 ， 可 以 
跳 过 它 。 另 外 ， 学 习 这 些 例子 将 会 使 递归 看 起 来 更 强大 ， 而 不 是 更 有 趣 。 l 


8.4.1 一 个 来 自 计 算 机 艺术 的 实例 

20 世纪 初 ， 在 巴黎 发 生 了 一 场 有 争议 的 艺术 运动 ， 这 很 大 程度 上 受到 了 巴 勃 罗 “' 毕 加 
索 和 乔治 布 拉 克 的 影响 。 立 体 派 〈 正 如 评论 家 对 他 们 的 称谓 ) 拒绝 了 传统 的 关于 透视 法 和 
表象 主义 的 艺术 概念 ， 取 而 代 之 的 是 产生 了 基于 简单 的 几何 图 形 的 高 度 分 散 的 作品 。 在 立体 
派 的 强烈 影响 下 ， 和 荷兰 画家 彼 特 ' 蒙 德里 安 (1872 一 1944 ) 创造 了 一 系列 的 基于 水 平和 垂直 
线条 的 作品 。 这 些 图 画 的 递归 结构 使 得 它们 成 为 计算 机 仿真 的 理想 候选 者 。 

例如 ， 假 设 你 想 产 生 一 幅 类 似 蒙 德里 安 风 格 的 作品 ， 如 下 图 所 示 : 


采用 图 形 库 ， 你 如 何 设计 一 个 一 般 的 策略 来 创建 这 样 一 个 图 形 ? 
将 创建 图 的 过 程 看 作 是 一 种 连续 的 分 解 ， 将 有 助 于 理解 一 个 程序 是 怎样 产生 这 样 一 个 图 
[68] WBN. 首先 ， 画布 只 是 一 个 空 的 矩形 ， 如 下 图 所 示 : 


如 果 你 想 使 用 水 平和 和 拭 直线 条 将 画布 细 分 ， 开 始 最 容易 的 方法 是 画 一 条 单独 的 直线 将 这 个 矩 
形 一 分 为 二 : 


如 果 你 正在 递归 地 思考 这 个 问题 ， 值 得 注意 的 是 你 现在 有 两 个 空 的 矩形 画布 ， 其 中 每 个 
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画布 在 尺寸 上 都 比 原来 的 大 画布 小 。 细 分 这 些 矩 形 的 任务 和 之 前 一 样 ， 所 以 你 可 以 使 用 递归 


的 相同 的 步骤 去 完成 它 。 


完成 一 个 递归 策略 唯一 需要 的 是 一 个 简单 情况 。 分 解 矩 形 的 过 程 不 能 无 限 地 进行 下 去 。 
随 着 矩形 变 得 越 来 越 小 ， 在 某 一 时 刻 这 个 过 程 必须 停止 。 一 种 方法 是 在 你 开始 之 前 ， 查 看 一 


下 每 个 矩形 的 面积 。 一 旦 一 个 矩形 的 面积 低 于 某 个 冰 值 ， 就 不 需要 继续 细 分 了 。 


图 8-3 中 的 Mondrian.cpp 程序 利用 完整 的 图 形 窗口 作为 初始 的 画布 ， 实 现 了 这 个 递 
归 算 法 。 在 Mondrian.cpp 程序 中 ， 递 归 函 数 subdivideCanvas 做 了 所 有 的 工作 。 参 
数 给 出 了 画布 中 当前 矩形 的 位 置 和 尺寸 。 在 分 解 的 每 一 步 ， 该 函数 只 是 简单 地 检测 所 观察 的 
和 矩形 是 否 足够 大 进而 能 被 再 分 解 。 如 果 是 ， 函 数 将 检测 观察 哪 一 个 尺寸 ( 宽 或 高 ) EK, IF 
以 此 为 依据 使 用 垂直 或 水 平 的 线条 将 矩形 分 开 。 对 于 上 述 每 一 种 情况 ， 函 数 只 画 一 条 单独 的 


直线 ， 图 形 中 剩余 的 直线 是 在 随后 的 递归 调用 中 画 出 的 。 


/* 
* File: Mondrian. cpp 
* - aa — m 


/ 


#include <iostream> 
#include "gwindow.h" 
#include "random.h" 
using namespace std; 


/* Constants */ 


const double MIN AREA = 10000; /* Smallest square that wall be split 
const double MIN EDGE = 20; * Smallest edge length allowed 


/* Function prototypes */ 


void subdivideCanvas(GWindow & gw, double x, double y, 
double width, double height); 


/* Main program * 


int main() ( 
GWindow gw; 
subdivideCanvas(gw, 0, 0, gw.getWidth(), gw.getHeight ()); 
return 0; 


Function: subdivideCanvas 
Usage: subdivideCanvas(gw, x. y, width, height) 


recursion continues until the area falls below the constant MIN AREA 


/* 
* 
* 
* 
* 
* 
* 
* 


/ 


void subdivideCanvas (GWindow & gw, double x, double y, 
double width, double height) { 
if (width * height >= MIN AREA) ( 

if (width » height) ( 
double mid - randomReal(MIN EDGE, width - MIN EDGE); 
subdivideCanvas(gw, x, y, mid, height); 
subdivideCanvas (gw, x + mid, y, width - mid, height); 
gw.drawLine(x + mid, y, x + mid, y + height); 

) eise ( 
double mid - randomReal(MIN EDGE, height - MIN EDGE); 
subdivideCanvas(gw, x, y, width, mid); 
subdivideCanvas(gw, x, y + mid, width, height - mid); 
gw.drawLine(x, y + mid, x + width, y + mid); 


8-3 ”使 用 了 类 似 蒙 德里 安 风格 将 平面 细 分 的 程序 


Decomposes the specified rectangular rex on the canvas recursively 
by splitting that rectangle randomly alo its larger dimension The 





* This program creates à line drawing in a style reminiscent of Mondrian 
* 


+} 
/ 
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8.4.2 4€ 


20 世纪 70 EREK, —% IBM 的 研究 员 本 华 . 曼 德 博 ( 1924 一 2010 )， 出 版 了 一 本 关于 
分 形 的 书籍 ， 该 书 引起 了 人 们 极 大 的 兴趣 。 分 形 是 相同 的 模式 在 许多 不 同 的 尺度 下 被 重复 使 
用 的 几何 结构 。 尽 管 数学 家 了 解 分 形 很 长 一 段 时 间 了 ， 但 在 20 世纪 80 年 代 又 重新 引起 了 人 
们 对 它 的 兴趣 ， 部 分 原因 是 : 由 于 计算 机 的 发 展 ， 人 们 对 分 形 可 以 做 比 以 前 更 多 的 事情 。 

最 早 的 分 形 例子 就 是 海里 格 ' 冯 ' 科 赫 (1870 一 1924 ) 发 明 的 科 赫 雪花 分 形 (Koch 
snowflake ) 。 科 赫 雪 花 分 形 是 以 一 个 等 边 三 角形 开始 的 ， 如 下 图 所 示 : 


V 


每 条 边 都 为 直线 的 三 角形 被 称 为 0 阶 科 赫 曲线 。 然 后 逐步 修正 这 个 图 以 产生 相继 更 高 阶 的 分 
形 。 在 其 中 的 每 个 阶段 ， 图 中 的 每 一 条 线段 都 被 一 个 分 形 所 代替 ， 其 中 中 间 的 第 三 部 分 包含 
一 个 从 图 中 向 外 突出 的 三 角形 凸 块 。 因 此 ， 第 一 步 将 三 角形 中 的 线段 用 这 样 的 线 来 代替 ， 如 


下 图 所 示 : 


370 
l 
将 这 种 转换 应 用 到 原 三 角形 的 每 一 条 边 ， 产 生 1 阶 科 赫 雪花 分 形 ， 如 下 图 所 示 : 


M 


然后 ， 如 果 你 用 一 条 新 的 线 来 替换 这 个 图 中 的 每 一 条 线段 ， 新 的 线 将 再 次 包含 一 个 三 角 
棉 形 ， 你 就 创建 了 以 下 2 阶 的 科 赫 雪花 分 形 : 
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继续 蔡 换 所 有 这 些 线段 ， 会 产生 3 阶 分 形 ， 看 起 来 更 像 一 片 雪花 ， 如 下 图 所 示 : 


因为 像 科 赫 雪 花 分 形 这 样 的 图 用 计算 机 比 用 手 更 容易 画 出 来 ， 因 此 编写 这 样 一 个 程序 
是 有 意义 的 ， 该 程序 使 用 了 graphics.h 接口 提供 的 工具 来 产生 这 个 设计 。 尽 管 可 以 仅 
使 用 drawLine 方法 来 画 不 规则 的 雪花 图 形 ， 但 使 用 Gwindow 类 中 的 drawPolarLine 
方法 通常 显得 更 容易 ， 它 能 让 你 确定 一 条 线 的 长 度 和 方向 。 在 数学 中 ， 一 条 分 割 线 的 长 
度 和 方向 按照 惯例 是 用 符号 r 和 6 表示 ， 它 被 称 为 极 坐 标 ( polar coordinate)。 下 图 展示 
了 极 坐 标的 用 法 ， 其 中 实 线 长 度 为 r， 并 从 起 点 向 外 延伸 ， 实 线 的 位 置 是 沿 x 轴 逆 时 针 旋 转 
0 度 : 


r 


0 xl 


drawPolarLine 方 法 读 取 起 点 坐标 (无 论 是 作为 一 个 单独 的 坐标 还 是 作为 一 个 
GPoint 对 象 )， 并 返回 线段 另 一 个 端点 的 坐标 ， 从 而 更 容易 将 连续 的 线段 连接 在 一 起 。 例 
如 ， 下 面 的 代码 画 出 了 一 个 向 下 的 等 边 三 角形 ， 它 的 左上 和 角 处 于 pt 的 原始 值 处 : 

pt = gw.drawPolarLine(pt, size, 0); 

pt = gw.drawPolarLine(pt, size, -120); 

pt = gw.drawPolarLine(pt, size, +120); . 

这 段 代码 创建 了 0 阶 雪花 分 形 。 为 了 产生 更 高 阶 的 分 形 ， 你 需要 将 drawPolarLine 调用 
以 一 个 名 为 drawFractalLine 的 函数 蔡 换 ， 该 函数 拥有 (除了 图 形 窗口 ) 一 个 额外 的 参 
数 表示 分 形 线 的 阶 数 ， 如 下 所 示 : 

pt = drawFractalLine(gw, pt, size, 0, order); 

pt - drawFractalLine(gw, pt, size, -120, order); 

pt = drawFractalLine(gw, pt, size, +120, order); 

剩 下 的 唯一 任务 就 是 实现 drawFractalLine 函数 ， 如 果 你 能 递归 地 思考 ， 它 很 容易 
完成 。 当 order 为 0 时 ，drawFractalLine 的 简单 情况 就 会 发 生 ， 此 时 ， 函 数 只 需 简 
单 地 画 一 条 确定 了 长 度 和 方向 的 直线 。 如 果 order 大 于 0， 分 形 线 就 会 被 分 成 四 部 分 ， 每 
一 部 分 都 是 一 条 更 低 阶 数 的 分 形 线 。 像 drawPolarLine M@&—#, drawFractalLine 
函数 返回 它 画 的 上 一 条 线段 的 终点 ， 这 样 下 一 条 分 形 线 可 以 在 上 一 条 分 形 线 结束 的 地 方 开 
th. Snowflake 程序 的 完整 实现 显示 在 图 8-4 中 ， 其 中 包含 了 drawFractalLine 的 完整 
代码 。 
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File: Snowflake.cpp 
#include <iostream> 
#include <cmath> 
#include "gwindow.h" 
using namespace std; 
/* Constants */ 
const double SIZE = 200; /* Size of the order 0 fractal in pixels */ 
const int ORDER = 4; /* Order of the fractal snowflake «/ 
/* Function prototypes */ 
GPoint drawFractalLine(GWindow & gw, GPoint pt, 
double r, double theta, int order); 
/* Main program */ 
int main() ( 
GWindow gw; 
cout << "Program to draw a snowflake fractal." << endl; 
double cx - gw.getWidth() / 2; 
double cy = gw.getHeight() / 2; 
GPoint pt(cx - SIZE / 2, cy - sqrt(3.0) * SIZE / 6); 
pt = drawFractalLine(gw, pt, SIZE, 0, ORDER); 
pt = drawFractalLine(gw, pt, SIZE, -120, ORDER); 
pt = drawFractalLine(gw, pt, SIZE, +120, ORDER); 
return 0; 
Function: drawFractalLine 
Usage: GPoint end = drawFractalLine(qgw, ` , theta, order); 
Draws a fractal edge starting from pt and extending r units in direction 
theta If order » 0, the edge is divided into four fractal edges of the 
* next lower order The function returns the endpoint of the line 
GPoint drawFractalLine(GWindow & gw, GPoint pt, 
double r, double theta, int order) 1{ 
if (order == 0) ( 
return gw.drawPolarLine(pt, r, theta); 
} else { 
pt = drawFractalLine(gw, pt, r / 3, theta, order - 1); 
pt = drawFractalLine(gw, pt, r / 3, theta + 60, order - 1); 
pt = drawFractalLine(gw, pt, r / 3, theta - 60, order - 1); 
return drawFractalLine(gw, pt, r / 3, theta, order - 1); 
374 图 8-4 画 科 赫 雪花 分 形 的 程序 
=x 
本 章 小 结 


本 章 引 入 了 较 少 的 新 概念 ， 因 为 递归 的 基本 思想 已 经 在 第 7 章 中 介绍 过 了 。 本 章 的 重点 
是 介绍 递归 例子 的 复杂 之 处 ， 这 些 问 题 用 其 他 方法 很 难 解决 。 鉴 于 这 些 问 题 较 高 的 复杂 性 ， 
学 生 刚 开始 学 的 时 候 经 常会 发 现 这 些 问题 比 前 面 章节 中 直到 的 问题 更 难 理解 。 这 些 问题 的 确 
更 难 ， 但 是 递归 就 是 一 个 解决 难题 的 工具 。 为 了 掌握 它 ， 你 需要 针对 这 个 级 别 的 复杂 性 问题 
进行 实战 。 
本 章 的 重点 包括 : 
e. 每 当 你 想 要 将 递归 应 用 到 一 个 程序 问题 中 时 ， 你 必须 设计 一 种 策略 ， 将 原 问题 转换 
成 相同 形式 的 更 简单 的 问题 。 当 你 找到 了 一 个 递归 策略 的 切 人 点 ， 才 会 有 办 法 应 用 
递归 的 知识 。 
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e 一 旦 你 定义 了 一 个 递归 方法 ， 对 你 而 言 ， 重 要 的 是 : 检测 你 的 策略 并 确保 它 不 会 违 
反问 题 施加 的 任何 条 件 。 

e 当 你 尝试 解决 的 问题 的 复杂 性 有 所 增加 时 ， 接 受 递 归 的 稳步 跳跃 的 重要 性 也 会 增加 。 

e 递归 并 不 神奇 。 如 果 你 需要 这 样 做 ， 可 以 通过 画 出 每 个 过 程 的 栈 帧 内 容 来 模拟 计算 
机 的 操作 ， 这 些 栈 帧 在 问题 解决 的 过 程 中 被 调用 。 男 一 方面 ， 不 要 报 以 怀疑 的 态度 
是 至 关 重 要 的 ， 因 为 怀疑 将 会 强迫 你 去 看 所 有 基本 的 细节 。 


复习 题 

1. 用 你 自己 的 话 ， 描 述 解决 汉 诺 塔 问题 必要 的 递归 思路 。 

2. 下 面 这 种 解决 汉 诺 塔 问题 的 策略 在 结构 上 和 书 中 所 使 用 的 策略 相似 : 
a. 将 最 上 面 的 圆 盘 从 开始 的 塔 柱 移 到 临时 塔 柱 上 。 
b. 将 N 一 1 个 圆 盘 从 开始 的 塔 柱 移 到 最 终 的 塔 柱 上 。 
c. 将 当前 处 于 临时 塔 柱 上 的 圆 盘 移 回 到 最 终 的 塔 柱 上 。 


为 什么 这 个 策略 失败 了 ? 
3. 如 果 你 调用 
moveTower(16, 'A', 'B', 'C') 375 


作为 解决 方案 的 第 一 步 , movesingleDisk 将 会 显示 什么 语句 ? 这 个 解决 方案 的 最 后 一 步 是 什么 ? 
4. 什么 是 排列 ? 
5. 用 你 自己 的 话 ， 解 释 一 下 枚 举 一 个 字符 串 中 字符 排列 情况 所 需 的 递归 的 思路 。 
6. FIFE "wxvz" 有 多 少 种 排列 情况 ? 
7.Mondrian.cpp 中 ， 什 么 样 的 简单 情况 结束 了 递归 过 程 ? 
8. 画 出 1 阶 雪花 分 形 图 。 
9. 有 多 少 条 线段 出 现在 2 阶 雪花 分 形 中 ? 


习题 
1. 遵循 moveTower 函数 的 逻辑 ， 编 写 一 个 递归 函数 countHanoiMoves (n)， 它 计算 解决 n 个 圆 盘 


的 汉 诺 塔 问 题 所 需要 移动 圆 盘 的 次 数 。 
2. 为 了 使 程序 的 操作 稍微 容易 解释 ， 在 本 章 ，moveTower 的 实现 使 用 了 : 


if (n == 1) 


作为 它 的 简单 情况 测试 。 当 你 看 到 一 个 递归 程序 使 用 1 作为 它 的 简单 情况 时 ， 这 有 点 值得 怀疑 ; 在 
大 部 分 应 用 中 ，0 是 一 个 更 合适 的 选择 。 重 写 汉 诺 塔 程序 ， 使 得 moveTower 的 检测 条 件 为 n 是 否 
等 于 0。 此 时 ，moveTower 实现 代码 的 长 度 会 发 生 什 么 变化 ? 

3. 重 写 汉 诺 塔 程序 ， 它 使 用 一 个 显 式 的 待 处 理 任务 栈 来 代替 递归 。 此 时 ,一 个 任务 最 容易 表示 为 包含 
将 要 移动 的 圆 盘 的 数目 ， 作 为 开始 、 结 束 和 临时 仓库 的 塔 柱 的 名 称 的 一 种 结构 。 在 这 个 过 程 的 一 开 
始 ， 你 的 栈 放置 了 一 个 移动 整个 塔 的 任务 。 然 后 ， 程 序 反 复出 栈 并 执行 任务 ， 直 到 在 栈 中 发 现 没 有 
剩余 的 任务 为 止 。 除 了 简单 情况 , .执行 一 个 任务 的 过 程 导致 了 更 多 任务 的 创建 ， 这 些 任务 将 被 放 进 
栈 中 便于 后 来 的 执行 。 

4. 在 8.2 节 介绍 的 子 集 求 和 问题 中 ,通常 有 几 种 方法 可 以 产生 期 望 的 目标 值 。 例 如 ， 给 定 集合 1376 
{1,3,4,5} ， 有 两 种 不 同 的 方法 产生 目标 值 5: 

e 选择 1 和 4。 
e 只 选择 5. 
相 比 之 下 ， 没 有 办 法 来 划分 集合 (1,3,4,5) 得 到 11。 
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编写 一 个 函数 : 
int countSubsetSumWays (Set<int> & set, int target); 
它 返 回 对 于 给 定 的 集合 为 产生 目标 值 你 能 选择 的 子 集 数 。 例 如 ， 假 设 sampleset 已 经 被 如 下 初 
始 化 : 


Set<int> sampleSet; 
sampleSet += 1, 3, 4, 5; 


给 定 sampleSet 的 定义 ， 调 用 
countSubsetSumWays (sampleSet, 5); 

应 该 返回 2 (有 两 种 方法 可 以 得 到 5 )， 调 用 
countSubsetSumWays (sampleSet, 11) 

应 该 返回 0 (没有 方法 得 到 11). 


.编写 程序 Embeddedworads， 它 能 找 出 所 有 的 英语 单词 ， 这 些 单 词 可 以 通过 提取 来 自 一 个 给 定 


的 初始 单词 的 字母 的 子 集 来 组 成 。 例 如 ， 给 出 初始 的 单词 “happy”， 你 一 定 可 以 产生 单词 “a”、 
“ha”“hap” 和 “happy”， 其 中 字母 是 连续 出 现 的 。 你 也 可 以 产生 单词 “hay“ 和 “ay”， 因 为 
这 些 字母 在 happy 中 是 以 从 左 到 右 的 顺序 出 现 的 。 然 而 ， 你 却 不 能 产生 单词 “pa” 或 “pap”， 因 
为 这 些 字母 (即使 它们 出 现在 单词 中 ) 并 不 是 以 正确 的 顺序 出 现 的 。 程 序 的 一 个 示例 运行 结果 如 下 
图 所 示 : 





.我 是 父母 唯一 的 进行 权衡 、 度 量 和 定价 一 切 的 孩子 ; 


对 他 们 而 言 ， 任 何 东西 都 不 能 被 权衡 、 度 量 、 定 价 和 存在 。 
一 一 查尔斯 ， 狄更斯 ,《 小 杜 丽 》(Little Dorrit), 1857 


在 狄更斯 时 代 ， 商 人 使 用 硅 码 和 有 两 个 盘子 的 天 平 来 称 量 很 多 商品 一 一 今天 ， 这 个 惯例 在 世界 许多 
地 方 仍 持续 着 。 然 而 ， 如 果 你 使 用 有 限 的 一 组 夸 码 ， 只 能 称 量 一 定 的 数量 。 例 如 ， 假 设 你 只 有 两 个 
REB). 一 个 1 但 司 9 的 夸 码 和 一 个 3 盘 司 的 硅 码 。 有 了 这 两 个 硅 码 ， 你 可 以 轻易 地 称 量 出 4 den], 


如 下 图 所 示 : 
Ba aa 


一 个 更 有 趣 的 发 现 是 : 通过 将 1 ae EAER FAA, MAT RR 2 ER], MPA 
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编写 一 个 递归 函数 

bool isMeasurable (int target, Vector<int> & weights) 

该 函数 的 作用 是 利用 给 定 的 一 组 夸 码 (它们 存储 在 矢量 weights 中 )， 判断 是 否 可 以 称 量 出 期 望 的 
目标 数量 。 

例如 ， 假 设 sampleWeights 函数 已 经 如 下 所 示 被 初始 化 : 


Vector<int> sampleWeights; 
sampleWeights += 1, 3; 


根据 这 些 值 ， 函 数 调用 
isMeasurable(2, sampleWeights) 
应 返回 true， 因 为 它 可 以 使 用 前 面 图 形 中 所 示 的 硅 码 的 放 法 ， 称 量 出 2 盎司 。 然 而， 调用 


isMeasurable(5, sampleWeights) 378 


应 返回 false， 因 为 它 不 可 能 使 用 1 ara) Al 3 ft El AJRATIP EH 5 url. 


.在 被 称 为 克 里 比 奇 (Cribbage) 的 纸牌 游戏 中 ,一 副 五 张 扑克 牌 加 起 来 的 分 数组 成 了 游戏 的 一 部 分 。 


分 数 的 其 中 一 个 组 成 部 分 是 不 同 的 扑克 牌 组 合 中 的 各 个 扑克 有 牌 上 的 分 值 ， 要 求 这 些 扑克 有 牌 组 合 其 扑 
克 牌 上 的 分 值 之 和 等 于 15, A 的 分 数 记 为 1， 所 有 的 花 牌 (J、Q 和 开 ) 分 数 记 为 10。 例 如 ， 考 虑 下 


面 的 扑克 有 牌 : 
4 ado dh 
+ ^ 
"Bet 


扑克 牌 分 值 之 和 等 于 15 有 三 种 不 同 的 组 合 ， 如 下 所 示 : 
AD 十 10S 十 4H AD+5C+9C 5C+10S 
考虑 第 二 种 示例 ， 组 合 中 的 扑克 有 牌 如 下 图 所 示 : 


J 
| 
B p 网 四 a 


它 包含 以 下 八 种 不 同 组 合 ， 它 们 的 扑克 牌 分 值 之 和 都 等 于 15: 








SC-+IC 5D--JC 5H--JC 5S--JC 
5C+5D+5H 5C+5D+5S 5C+5H+5S 5D+5H+5S 
编写 一 个 函数 : 


int countFifteens (Vector<Card> & cards); 


它 接 收 一 副 扑克 牌 值 的 矢量 (正如 第 6 章 习 题 2 中 定义 的 )， 并 返回 你 可 以 从 这 副 牌 中 选取 其 分 
值 之 和 为 15 的 组 合 方法 的 数量 。 解 决 该 问题 ， 你 不 需要 对 card 类 了 解 太 多 。 你 唯一 需要 的 是 
getRank 方法 ， 它 返回 每 张 扑克 牌 所 对 应 的 排序 整数 值 。 你 可 以 假设 card.h 接口 提供 了 名 为 
ACE, JACK, QUEEN 和 KING 的 常量 ， 它 们 的 值 分 别 为 1、11、12 和 13。 379 


.第 8 章 展 示 的 递归 分 解 对 于 解决 产生 排列 的 问题 并 不 是 唯一 有 效 的 策略 。 另 一 种 实现 递归 的 方法 如 


下 所 示 : 
a) 去 除 字 符 串 中 的 首 字母 ， 并 将 其 存储 在 变量 ch 中 。 
b) 产生 包含 剩余 字符 所 有 排列 情况 的 集合 。 
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c) 将 ch 插入 到 这 些 排列 情况 中 每 一 个 可 能 的 位 置 ， 形 成 一 个 新 的 集合 。 
重 写 Permutations 程序 ， 要 求 它 使 用 这 个 新 的 策略 。 


.设计 实现 Permutations 程序 的 策略 是 为 了 强调 它 递归 的 字符 。 最 终 的 代码 并 非特 别 有 效 ， 大 部 


分 是 因为 它 以 产生 集合 结束 ， 并 且 这 些 集合 随后 就 被 抛弃 ， 也 因为 它 应 用 了 类 似 substr 的 方法 ， 

该 方法 要 求 复制 字符 串 中 的 字符 。 使 用 下 面 的 递归 公式 表述 可 以 消除 上 述 的 无 效 性 : 

a) 在 每 一 层 ， 传递 整个 字符 串 以 及 一 个 索引 ， 该 索引 表示 排列 过 程 的 开始 位 置 。 字 符 串 中 在 该 索引 
前 面 的 子 字符 串 保持 不 变 ; 而 在 这 个 索引 位 置 上 或 在 索引 位 置 后 的 字符 必须 出 现在 它们 所 有 的 排 
列 情况 中 。 

b) 当 索 引 到 达 了 字符 串 的 结尾 ， 简 单 情况 就 发 生 了 。 

c) 递归 操作 的 过 程 就 是 将 字符 串 中 索引 位 置 处 的 字符 和 其 他 字符 相交 换 ， 然 后 产生 下 一 个 更 高 索引 
位 置 开 始 的 每 一 种 排列 情况 ， 然 后 将 字符 交换 回去 确保 原来 的 顺序 能 被 还 原 。 

使 用 上 述 策略 实现 函数 : 


void listPermutations(string str); 


该 函数 在 标准 输出 设备 上 列举 了 字符 串 str 的 所 有 排列 情况 ， 并 且 不 使 用 任何 集合 ， 除 了 length 
和 选择 方法 之 外 ， 也 不 使 用 其 他 字符 串 方 法 。1istPermutations MMA AMAR AR aE A 
数 ， 它 作为 包含 索引 的 第 二 个 函数 。 

如 果 你 不 考虑 字符 串 中 的 重复 字符 ， 这 个 函数 相对 容易 实现 。 只 有 当 你 改变 算法 的 结构 时 ， 有 
趣 的 挑战 就 会 产生 ， 这 样 它 列举 每 一 个 唯一 的 排列 一 次 ， 并 且 不 使 用 集合 来 完成 该 任务 。 然 而 ， 你 
不 应 该 担心 listPermutations 输出 的 顺序 。 





10. 在 一 部 手机 键盘 上 ， 数 字 被 映射 到 字母 表 上 ， 如 下 图 所 示 : 





为 了 使 它们 的 电话 号 码 更 难忘 记 ， 服 务 供应 商 喜 欢 寻找 能 够 拼写 出 一 些 单词 ( 称 之 为 记忆 术 ) 的 数 
字 ， 这 些 单词 适合 他 们 的 生意 ， 使 得 电话 号 码 更 容易 记 住 。 

想象 一 下 ， 你 刚 被 一 家 本 地 的 手机 公司 雇用 ， 要 求 你 编写 一 个 listMnemonics MM, Her 
数 将 产生 对 应 于 一 个 给 定数 字 的 所 有 字母 组 合 情 况 ， 数 字 用 一 个 数字 字符 串 表 示 。 例 如 ， 调 用 
listMnemonics ("723") 
后 应 列举 出 以 下 对 应 于 前 缀 的 36 种 可 能 的 字母 排列 情况 : 
PAD PBD PCD QAD QBD QCD RAD RBD RCD SAD SBD SCD 


PAE PBE PCE QAE QBE QCE RAE RBE RCE SAE SBE SCE 
PAF PBF PCF QAF QBF QCF RAF RBF RCF SAF SBF SCF 


11. 重 写 习题 10 HEF, BOR EA Lexicon 类 和 Englishwords .dat 文件 ， 以 便 程序 只 列举 有 


效 的 英语 单词 的 记忆 方法 。 


12. 现在 ， 手 机 键盘 上 的 字母 并 不 是 用 于 增进 记忆 ， 而 是 为 了 发 短信 。 使 用 键盘 输入 文本 是 有 问题 的 ， 


因为 键盘 上 的 键 要 比 字 母 表 上 的 字母 少 很 多 。 一 些 手机 使 用 了 一 个 “多 按 式 ”的 用 户 界 面 ， 你 可 以 
按 一 次 “2” 键 得 到 a， 按 两 次 得 到 b， 按 三 次 得 到 c， 它 们 感觉 元 长 乏味 。 一 个 精简 的 选择 是 使 
用 一 个 预测 的 策略 ， 手 机 使 用 这 个 策略 猜测 你 打算 输入 的 字母 ， 它 是 以 到 目前 为 止 的 输入 序列 和 
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它 可 能 的 完成 概率 为 基础 的 。 

例如 ， 如 果 你 要 打出 数字 序列 72， 有 12 中 可 能 性 : pa. pb. pc. qa, qb, qc, ra, rb, 
rce, sa, sb 和 sc。 只 有 这 四 对 字母 (pa、ra、sa 和 sc) 看 起 来 有 希望 ， 因 为 它们 都 是 普通 的 
英语 单词 (f party. radio, sandwich 和 scanner) 的 前 级 。 其 他 的 可 以 被 忽略 ， 因 为 没 
有 常见 的 单词 是 以 这 些 字母 序列 开始 的 。 如 果 用 户 输入 “9956"”， 有 144 (4X4X3X3 ) 种 可 能 的 
字母 序列 ， 但 是 你 可 以 确定 用 户 表 示 的 是 xylo 的 意思 ， 因 为 只 有 唯一 的 一 个 序列 是 英语 单词 的 
Tif 235 

编写 函数 : 


void listCompletions (string digits, Lexicon & lex); 
输出 字典 中 的 所 有 单词 ， 要 求 这 些 单词 可 以 通过 扩展 给 定 的 数字 序列 来 形成 。 例 如 ， 调 用 
listCompletions ("72547", english) 


后 应 该 产生 下 面 的 示例 输出 : 





如 果 你 只 关心 获取 答案 ， 解 决 这 个 问题 最 容易 的 方法 是 迭代 字典 中 的 单词 ， 输 出 和 指定 的 数 
字 序 列 匹配 的 每 个 单词 。 这 个 方法 不 需要 递归 ， 也 不 怎么 用 思考 。 然 而 ， 你 的 经 理 认为 浏览 字典 
中 的 每 个 单词 速度 太 慢 ， 他 要 求 你 只 使 用 字典 一 次 来 检测 给 出 的 字符 串 是 否 是 一 个 单词 或 是 一 个 
英语 单词 的 前 级 。 有 了 这 个 约束 ， 你 需要 解决 如 何 从 数字 字符 串 中 生成 所 有 可 能 的 字母 序列 。 这 
个 任务 很 容易 递归 地 解决 。 


.很 多 蒙 德里 安 的 几何 图 画 用 一 些 颜色 来 填充 矩形 区 域 。 扩 展 文中 的 Mondrian 程序 ， 使 它 可 以 使 


用 随机 选择 的 颜色 来 填充 创建 的 矩形 区 域 的 某 些 部 分 。 


14. 像 美国 这 样 的 国家 仍 使 用 传统 的 英国 测量 系统 ， 一 个 直 尺 上 的 每 个 英寸 8 都 是 使 用 刻度 标记 划分 


的 ， 如 下 图 所 示 : 


Px Pl hes Pe 


最 长 的 刻度 标记 处 在 半 英 寸 的 位 置 ， 两 个 较 小 的 刻度 标记 表示 四 分 之 一 英寸 ， 更 小 的 刻度 标记 被 
用 来 标记 八 分 之 一 英寸 和 十 六 分 之 一 英寸 。 编 写 一 个 递归 程序 ， 在 图 形 窗 口 的 中 间 画 一 条 1 英寸 
的 直线 ， 然 后 画 出 如 上 图 所 示 的 刻度 标记 。 假 设 表示 半 英 寸 位 置 的 刻度 标记 的 长 度 已 经 由 常数 定 
义 给 出 : 

const double HALF INCH TICK = 0.2; 


并 且 每 一 个 更 小 的 刻度 标记 的 尺寸 是 下 一 个 更 大 刻度 标记 的 一 半 。 


15. 分 形 引起 人 们 如 此 大 兴趣 的 一 个 原因 是 : 它们 被 证 明 在 一 些 意外 的 现实 语 境 中 很 有 用 。 例 如 ， 最 成 


功 的 技术 是 画 计算 机 的 山 图 像 和 确定 的 其 他 景观 特征 ， 它 们 都 涉及 分 形 几何 学 的 使 用 。 
作为 这 个 问题 提出 时 的 一 个 简单 的 例子 ， 考 虑 一 下 将 两 个 点 A 和 B 用 一 个 分 形 连接 的 问题 ， 
它们 看 起 来 就 像 一 副 地 图 上 的 海岸 线 。 最 简单 的 可 行 策略 是 在 两 点 之 间 画 一 条 直线 : 


© 1 英寸 = 0.0254 米 。 
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an 


260 | 88$ 


A 


这 个 0 阶 海岸 线 ， 代 表 递 归 的 基本 情况 。 

当然 ， 现 实 的 海岸 线 沿 着 它 的 长 度 在 某 些 地 方 可 能 会 有 小 半岛 或 入 口 ， 所 以 你 期 待 一 种 更 现 
实 的 画 法 ， 画 出 的 海岸 线 偶尔 向 内 或 向 外 突出 。 作 为 第 一 次 近似 ， 你 可 以 使 用 相同 的 被 用 于 创建 
雪花 分 形 的 分 形 线 来 代替 直线 ， 如 下 图 所 示 : 


EX 


这 个 过 程 创建 了 1 阶 海岸 线 。 然 而 ， 海 岸 线 中 的 饥 齿 形状 并 不 总 是 指向 同一 个 方向 。 因 此 ， 画 一 
些 有 时 向 上 或 有 时 向 下 的 三 角 棉 形 是 很 重要 的 ， 假 设 它们 以 等 概率 出 现 。 

然后 ， 如 果 你 使 用 一 条 随机 方向 的 分 形 线 代替 1 阶 分 形 中 的 每 一 条 直线 段 ， 你 就 得 到 了 2 阶 
海岸 线 ， 如 下 图 所 示 : 


pra 


继续 这 个 过 程 ， 直 到 产生 一 幅 能 表达 显著 现实 意义 的 图 画 ， 如 5 阶 海岸 线 : 


A. 


编写 一 个 程序 ， 在 图 形 窗 口中 画 一 条 分 形 的 海岸 线 。 





. 如 果 你 搜索 网 络 上 的 分 形 设计 ， 你 会 发 现 很 多 比 本 章 展示 的 科 赫 雪花 分 形 更 复杂 的 图 形 。 一 个 是 


H- 分 形 ( H-fractal)， 其 中 重复 图 案 的 形状 像 一 个 正方 形 中 拉 长 的 字母 理 。 因 此 ，0 阶 的 H- 分 形 如 


下 图 所 示 : 


为 了 创建 1 阶 分 形 ， ae 


才 都 是 原 分 形 的 一 半 )， 如 下 图 所 示 : 
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为 了 创建 2 阶 分 形 ， 你 仅 需 要 将 更 小 的 H- 分 形 (尺寸 是 它们 所 连接 的 分 形 的 一 半 ) 添加 到 每 一 个 
开放 的 端点 。 这 个 过 程 产 生 了 下 面 的 2 阶 分 形 : 


编写 一 个 递归 函数 : 


drawHFractal(GWindow & gw, double x, double y, 
double size, int order); 


其 中 x 和 y 是 HH- 分 形 的 中 心 坐标 ，size 指定 了 宽度 和 高 度 ，order 表示 分 形 的 阶 数 。 作 为 一 个 
例子 ， 以 下 主 程序 : 


int main() { 

'  GWindow gw; 
double xc - gw.getWidth() / 2; 
double yc = gw.getHeight() / 2; 
drawHFractal(gw, xc, yc, 100, 3); 
return 0; 


} 
将 会 在 图 形 窗口 的 中 间 画 出 3 阶 分 形 ， 如 下 图 所 示 : 








. 2008 年 ， 为 了 庆祝 牛津 大 学 莫 德 林学 院 550 周年 庆 ， 他 们 委托 英国 艺术 家 马克 … UEM GE — 


个 名 为 Y 的 雕塑 ， 它 有 一 个 明确 地 递归 结构 。 这 个 雕塑 的 照片 出 现在 图 8-5 的 左边 ， 展 示 它 的 分 
形 设 计 的 图 出 现在 右边 。 鉴 于 它 的 分 支 结 构 ， 在 泥 林 格 的 雕塑 中 ， 基 本 的 图 案 被 称 作 一 个 分 形 树 
(fractal tree)。 树 是 以 一 个 简单 的 树干 开始 的 ， 树 干 使 用 一 条 直 的 垂直 线 表示 ， 如 下 图 所 示 : 


这 些 分 支 本 身 可 以 分 裂 形 成 新 的 分 支 ， 这 些 新 的 分 支 又 可 以 分 裂 形成 新 的 分 支 。 
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编写 一 个 程序 ， 利 用 图 形 库 画 出 滥 林 格 的 雕塑 中 的 分 形 树 。 如 果 你 将 这 个 过 程 应 用 到 8 阶 分 
形 上 ， 会 得 到 图 8-5 中 右边 的 图 形 。 





图 8-5 马克， 瀑 林 格 分 形 树 


18. 另 一 个 有 趣 的 分 形 是 谢 尔 宾 斯 基 三 角形 (Sierpinski Triangle)， 它 是 以 发 明 者 瓦斯 瓦 ， 谢 尔 宾 斯 基 
(1882 一 1969 ) 命名 的 。0 阶 的 谢 尔 宾 斯 基 三 角形 是 一 个 等 边 三 角形 : 





为 了 创建 一 个 N 阶 的 谢 尔 宾 斯 基 三 角形 ， 你 可 以 画 三 个 N 一 1 阶 谢 尔 宾 斯 基 三 角形 ， 它 们 每 一 条 边 
的 长 度 都 是 原 三 角形 的 一 半 。 这 三 个 三 角形 被 放 在 大 三 角形 的 三 个 角 上 ， 这 意味 着 1 阶 的 谢 尔 宾 
斯 基 三 角形 如 下 图 所 示 : 





该 图 中 间 向 下 的 三 角形 并 不 是 明确 地 画 出 来 的 ， 而 是 由 其 他 三 个 三 角形 的 边 构成 的 。 而 且 ， 面 积 
也 不 是 递归 地 被 细 分 ， 它 在 每 一 层 的 分 形 分 解 中 将 保持 不 变 。 因 此 ，2 阶 的 谢 尔 宾 斯 基 三 角形 在 图 
中 间 有 着 相同 的 开放 的 区 域 : 
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如 果 你 在 三 个 递归 层 上 继续 这 个 过 程 ， 你 将 得 到 5 阶 谢 尔 宾 斯 基 三 角形 ， 如 下 图 所 示 : 





编写 一 个 程序 ， 要 求 用 户 输入 一 条 边 的 长 度 和 分 形 的 阶 数 ， 并 在 图 形 窗 口中 间 画 出 最 终 的 谢 尔 宾 
斯 基 三 角形 。 388 
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Programming Abstractions in C++ 


回 测算 法 





发 现 真理 需要 的 是 探索 ， 而 不 是 证 据 。 真 理 总 是 来 源 于 实践 。 
一 一 西蒙 娜 . 韦 伊 ,《 纽 约 札记 》(7Ppe New York Notebook), 1942 


对 于 现实 世界 中 的 许多 问题 ， 其 解决 过 程 是 由 你 自己 的 一 系列 选择 构成 的 ， 每 一 次 选 
择 将 导致 你 在 某 些 路 上 走 得 更 远 。 如 果 你 做 出 了 一 组 正确 的 选择 ， 最 终 会 解决 问题 。 然 而 ， 
如 果 你 走 进 死胡同 或 者 发 现 你 某 些 地 方 做 出 了 错误 的 选择 ， 那 么 将 不 得 不 回溯 到 前 面 的 某 
个 选择 ， 并 且 尝 试 男 一 条 不 同 的 路 径 。 采 用 这 种 方式 的 算法 被 称 为 回溯 算法 (backtracking 
algorithm ) 。 

如 果 你 把 回溯 算法 当 作 是 一 条 重复 探索 路 径直 到 遇 到 问题 的 求解 方案 ， 那 么 其 过 程 似 乎 
有 具有 某 种 迭代 特性 。 然 而 ， 目 前 大 多 数 这 种 形式 的 问题 采用 递归 方法 更 容易 解决 。 递 归 的 基 
本 思想 很 简单 : 一 个 回溯 问题 有 一 个 解决 方案 ， 当 且 仅 当 至 少 有 一 个 更 小 的 回溯 问题 有 其 解 
决 方案 ， 这 些 更 小 的 回溯 问题 又 来 源 于 所 做 的 每 一 种 可 能 的 初始 化 选择 。 本 章 的 示例 旨 在 曾 
明 这 一 过 程 ， 并 且 展 示 递 归 算 法 在 这 一 领域 的 威力 。 


9.1 迷宫 的 递归 回溯 

曾几何时 ， 在 希腊 神话 时 代 ， 地 中 海 的 克 里 特 岛 被 暴君 迈 诺 斯 统治 着 。 迈 诺 斯 不 时 
地 向 雅典 索取 年 轻 的 男女 作为 贡品 来 祭祀 弥 诺 陶 洛 斯 (一 个 人 身 牛头 的 怪物 )。 为 了 安 
置 这 个 致命 的 怪物 ， 迈 诺 斯 迫使 他 的 侍者 代 达 鲁 斯 (一 个 工程 天 才 ， 后 来 通过 建造 一 对 
翅膀 而 逃脱 ) 在 克 诺 索 斯 建造 了 一 个 广阔 的 地 下 迷宫 。 那 些 来 自 雅 典 的 年 轻 的 贡品 将 被 
引入 迷宫 ， 并 在 逃 出 迷宫 之 前 被 弥 诺 陶 洛斯 吃 掉 。 这 个 悲剧 一 直 延 续 到 雅典 的 特 休 斯 
自愿 成 为 其 中 的 一 个 贡 唱 为 止 。 听 从 了 迈 诺 斯 的 女儿 阿里 阿 德 涅 的 建议 ， 特 休 斯 带 着 
一 把 剑 和 一 个 线 团 进入 了 迷宫 。 在 屠杀 了 怪物 以 后 ， 他 凭借 着 解 开 的 绳索 独自 沿 原 路 
返回 。 


9.1.1 右手 法 则 


阿里 阿 德 湿 的 策略 是 逃离 迷宫 的 一 种 方法 ， 但 不 是 每 个 困 在 迷宫 里 的 人 都 有 替 拥 有 一 卷 
绳子 。 幸 运 的 是 ， 逃 出 迷宫 还 有 其 他 的 可 取 之 径 。 在 这 些 策略 中 ， 最 著名 的 方法 被 称 为 右手 
法 则 (right-hand rule)， 它 可 以 用 下 面 的 伪 码 表示 : 


Put your right hand against a wall. 

while (vou have not yet escaped from the maze) ( 
Walk forward keeping your right hand on a wall. 

) 


为 了 可 视 化 右手 法 则 的 操作 ， 假 设 特 休 斯 现在 已 经 成 功 杀 掉 了 弥 诺 陶 治 斯 ， 并 且 现 在 他 
站 在 第 一 幅 图 中 由 特 休 斯 名 字 的 第 一 个 字母 ( 即 希 腊 字母 0) 标记 的 位 置 : 


Ex eal 


如 果 特 休 斯 把 他 的 右手 放 在 墙 上 ， 然 后 从 那儿 开始 遵循 右手 法 则 ， 他 将 探寻 出 下 图 由 虚线 勾 
勒 的 出 路 : 





i 
遗憾 的 是 ， 右 手法 则 并 不 是 在 每 一 个 迷宫 中 都 奏效 。 如 果 在 开始 位 置 周围 有 一 个 循环 ， 特 休 
斯 将 会 陷入 无 限 循环 中 ， 正 如 下 面 简单 的 迷宫 示例 展示 的 一 样 : 





9.1.2 寻找 一 种 递归 方法 


伪 码 中 while 循环 清楚 地 表明 : 右手 法 则 是 一 种 迭代 策略 。 然 而 ， 你 也 可 以 从 递归 的 
角度 思考 一 下 解决 迷宫 问题 的 过 程 。 为 此 ， 你 必须 采取 一 种 不 同 的 思维 模式 。 你 可 以 从 不 再 
寻找 一 条 完整 的 路 径 来 思考 这 个 问题 。 取 而 代 之 的 是 ， 你 的 目标 是 寻找 一 个 递归 策略 来 简化 
问题 ,一步 一 个 脚印 。 一 旦 简化 了 这 个 问题 ,你 就 可 以 用 相同 的 过 程 解决 该 问题 所 产生 的 每 ”[B91 
一 个 子 问题 。 

让 我 们 回 到 最 初 用 到 右手 法 则 的 迷宫 图 上 ， 即 把 你 的 右手 放 在 特 休 斯 的 位 置 。 从 最 开始 
的 布局 开始 ， 你 有 三 个 选择 ， 如 下 图 箭头 所 示 : 


个 
co 
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如 果 存 在 出 口 ， 它 一 定 就 是 这 些 出 路 中 的 其 中 一 条 。 此 外 ， 如 果 你 选择 了 正确 的 方向 ， 你 将 
离 解决 问题 更 进一步 。 那 么 沿 着 这 条 路 ， 迷 宫 也 会 因此 变 得 更 简单 ， 这 才 是 递归 解法 的 关 
键 。 这 种 观察 指出 了 必 不 可 少 的 递归 思维 。 当 且 仅 当 至 少 能 够 解决 图 9-1 中 的 一 个 新 迷宫 ， 
那么 原始 的 迷宫 便 可 得 以 解决 。 在 每 个 图 中 的 X 标记 着 原始 出 发 的 方 格 ， 而 且 它 作为 之 后 
的 任何 递归 解法 的 禁区 ， 因 为 最 佳 的 解法 永远 不 需要 回溯 到 这 个 方 格 。 

如 果 你 观察 图 9-1 中 所 示 的 迷宫 ,很 容易 看 到 (至 少 以 你 的 全 局 视角 ) 二 级 迷宫 标签 (a) 
和 (c) 表示 一 条 死路 ， 唯 一 的 解法 开始 于 二 级 迷宫 (b) 所 示 的 方向 。 然 而 ， 如 果 你 递归 地 
思考 ， 就 不 需要 不 断 地 分 析 直 到 找到 所 有 的 解法 。 你 已 经 将 问题 分 解 成 了 更 简单 的 问题 。 你 
et tit a saan mi 你 仍然 必须 确 

一 系列 的 简单 情况 ， 从 而 递归 才能 结束 ,但 是 困难 的 工作 已 经 完成 


ES] [e] 


图 9-1 c NONE 


9.1.3 ”确定 简单 情况 


迷宫 问题 中 ， 什 么 构成 了 简单 情况 ? 一 种 可 能 是 你 已 经 站 在 迷宫 外 面 了 。 如 果 这 样 的 
话 ， 你 已 经 完成 了 。 显 然 ， 这 一 处 境 代表 一 种 简单 情况 。 然 而 ， 还 有 其 他 的 可 能 性 。 你 也 可 
能 会 到 达 一 个 死胡同 ， 此 时 ， 你 不 能 往 其 他 地 方 移动 了 。 例 如 ， 如 果 你 尝试 解决 下 图 的 迷宫 
实例 ， 通 过 向 北 移 动 ， 然 后 沿 着 那 条 路 一 直 调 用 递归 ， 你 将 最 终 站 在 你 尝试 解决 的 下 面 的 迷 
富 中 的 位 置 ; 


此 时 ， 你 已 经 尝试 完 所 有 可 移动 的 空间 了 。 从 新 的 位 置 延伸 出 来 的 每 一 条 路 要 么 被 标记 
了 ， 要 么 被 墙 挡住 了 ， 很 明显 ， 从 这 个 点 出 发 ， 迷 富 是 没有 解 的 。 因 此 ， 迷 富 问题 有 了 第 
二 种 简单 情况 ， 即 前 面 方 格 的 每 一 个 方向 都 被 堵 住 了 ， 要 么 是 一 堵 墙 ， 要 么 是 一 个 标记 过 
的 方 格 。 

当 你 考虑 可 以 移动 的 方向 时 ， 你 在 这 些 方 格 上 进行 递归 调用 ， 而 不 是 检查 已 标记 过 的 
方 格 ， 那 将 很 容易 对 递归 算法 进行 编码 。 在 程序 开始 时 ， 如 果 你 检查 当前 的 方 格 是 否 被 标记 
过 ， 就 可 以 以 此 作为 条 件 来 终止 递归 。 上 毕竟， 如 果 你 发 现 自己 站 在 一 个 被 标记 过 的 方 格 上 ， 
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就 必须 折返 ， 这 意味 着 最 佳 的 解法 肯定 在 其 他 方向 上 。 
因此 ， 此 问题 的 两 种 简单 情况 如 下 所 示 : 
1. 如 果 当 前 的 方 格 在 迷宫 之 外 ， 那 么 迷宫 问题 就 解决 了 。 
2. 如 果 当 前 方 格 被 标记 过 ， 那 么 迷宫 问题 没有 解决 ， 至 少 目前 沿 着 你 选 的 这 条 路 不 行 。 


9.1.4 对 迷宫 问题 的 解决 算法 进行 编码 


尽管 在 概念 层面 上 ， 用 来 解决 问题 的 递归 思维 和 简单 情况 是 你 所 需要 的 ， 但 编写 一 个 完整 
的 程序 来 导航 迷宫 也 需要 你 考虑 许多 实现 的 细节 。 例 如 ， 你 需要 决定 迷宫 本 身 的 表示 ， 标 出 墙 
的 位 置 ， 记 录 当 前 位 置 ， 表 示 一 个 特定 的 方 格 被 标记 过 ， 并 且 判 断 你 是 否 已 经 逃离 迷宫 。 虽 然 
为 迷宫 设计 一 个 合适 的 数据 结构 本 身 是 一 个 有 趣 的 编程 挑战 ， 但 是 这 与 我 们 理解 递归 算法 一 一 
我 们 讨论 的 焦点 ， 关 系 并 不 大 。 但 是 如 果 数 据 结构 的 细节 设计 得 不 好 ， 也 很 可 能 让 你 迷失 ， 
并 且 使 你 在 整体 上 理解 算法 策略 变 得 更 加 困难 。 幸 运 的 是 ,通过 引入 一 个 新 的 接口 ， 我 们 
可 以 把 数据 结构 的 细节 放置 一 边 来 隐藏 复杂 性 。 图 9-2 的 maze. n 接口 提供 了 一 个 被 称 为 
Maze 的 类 ， 它 将 所 有 在 迷宫 中 记录 通路 以 及 将 迷宫 展现 在 图 形 窗 口 的 必要 信息 封装 在 其 中 。 


/* 
* File: maze.h 
* 


* This interface exports the Maze class. 
* 


#ifndef maze h 
#define maze h 


#include <string> 
#include "grid.h" 
#include "gwindow.h" 
#include "point.h" 


* 
* Class: Maze 
* 


* This class represents a two-dimensional maze contained in a rectangular 
* grid of squares. The maze is read from a data file in which the 

* characters '*', '-', and '|' represent corners, horizontal walls, and 

* vertical walls, respectively; spaces represent open passageway squares. 
* The starting position is indicated by the character 'S'. For example, 
* the following data file defines a simple maze: 

* 


class Maze ( 
public: 
/* 


* Constructor: Maze 
* Usage: Maze maze(filename); 
* Maze maze(filename, gw); 


* Constructs a new maze by reading the specified data file. If the 
* second arqument is supplied, the maze is displayed in the center 
* of the graphics window. 


17 


Maze(std::string filename); 
Maze (std::string filename, GWindow & gw); 





图 9-2 maze.h 接口 
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Method: getStartPosition 
Usage: Point start = maze.getStartPosition(); 


Returns a Point indicating the coordinates of the start square. 


al 


Point getStartPosition(); 


Method: isOutside 
; if (maze.isOutside(pt)) 


Returns true if the specified point is outside the boundary of the maze. 
bool isOutside(Point pt); 
Method: wallExists 

* Usage: if (maze.wallExists(pt, dir)) 


Returns true if there is a wall in direction dir from the square at pt 


bool wallExists(Point pt, Direction dir); 


* Method: markSquare 
Usage: maze.markSquare (pt); 


Marks the specified square in the maze. 
LA 
void markSquare (Point pt); 
/* 
* Method: unmarkSquare 
* Usage: maze.unmarkSquare (pt); 


* Unmarks the specified square in the maze. 


*/ 
void unmarkSquare (Point pt); 
Method: isMarked 


Usage: if (maze.isMarked(pt)) 


Returns true if the specified square is marked. 


bool isMarked(Point pt); 
}; 
#endif 





图 9-2 ( 续 ) 


一 旦 你 能 够 访问 Maze 类 ， 编写 一 个 程序 来 解决 迷宫 问题 就 变 得 更 简单 了 。 这 道 习 题 的 
目的 是 编写 这 样 一 个 函数 : 


bool solveMaze (Maze & maze, Point pt); 


solveMaze 的 参数 是 : (1) 一 个 保存 数据 结构 的 Maze MR; (2) 起 始 位 置 ， 对 于 每 一 个 
递归 子 问题 ， 它 会 改变 。 由 于 确保 当 找到 一 个 解决 方案 时 递归 可 以 终止 ， 故 当 解决 方案 被 找 
到 时 ，solveMaze 国 数 返回 true, AMIR false, 

给 出 solveMaze 的 定义 ， 主 程序 如 下 所 示 : 


int main() ( 
initGraphics(); 
Maze maze("SampleMaze.txt"); 
maze.showInGraphicsWindow(); 
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if (solveMaze(maze, maze.getStartPosition())) { 
cout << "The marked path is a solution." << endl; 


] else { 
cout «« "No solution exists." «« endl; 
} 394 
return 0; l 
} 396 


solveMaze fll adjacentPoint (start,dir) 函数 的 代码 都 显示 在 图 9-3 中 ， 如 果 
你 从 起 始 位 置 向 一 个 特定 的 方向 移动 ， 后 者 会 返回 你 到 达 的 位 置 。 


Function: solveMaze 
Usage: solveMaze (maze, 


Attempts to generate a solution to the current maze from the specified 
start point The solveMaze function returns true if the maze has a 
solution and false otherwise The implementation uses recursion 

to sojve the submazes that result from marking the current square 

and moving one step along each open passage. 

/ 


bool solveMaze(Maze & maze, Point start) { 
if (maze.isOutside(start)) return true; 
if (maze.isMarked(start)) return false; 
maze.markSquare (start); 
for (Direction dir = NORTH; dir <= WEST; dir++) ( 
if (!maze.wallExists(start, dir)) ( 
if (solveMaze(maze, adjacentPoint(start, dir))) 
return true; 
) 
) 
} 
maze.unmarkSquare (start); 
return false; 


Function: adjacentPoint 
Usage; Point finish = adjacentPoint(start, dir); 


Returns the point that results from moving cne square from start 

in the direction specified by dir. For example, if pt is the 

point (1, 1), calling adjacentPoint(pt, EAST) returns the 

point (2, 1) To maintain consistency with the graphics package, 

the y coordinates increase as you move downward on the screen Thus, 
moving NORTH decreases the y component, and moving SOUTH increases it. 


/ 


Point adjacentPoint(Point start, Direction dir) { 
switch (dir) { 
case return Point(start.getX(), start.getY() - 1); 
case : return Point(start.getX() + 1, start.getY()); 
case : return Point(start.getX(), start.getY() + 1); 
case : return Point(start.getX() - 1, start.getY()); 
) 


return start; 





图 9-3 solveMaze 函数 的 实现 397 


9.1.5 说服 你 自己 那个 方案 可 行 


为 了 有 效 地 使 用 递归 ， 在 某 些 情况 下 你 必须 能 够 看 到 如 图 9-3 所 示 的 solveMaze 递归 
函数 ， 并 对 自己 说 :“ 我 明白 它 如 何 运行 。 问 题 会 变 得 越 来 越 简单 ， 因 为 每 一 次 递归 都 会 有 
更 多 的 方 格 被 标记 。 而 且 简单 情况 显然 是 正确 的 。 这 段 代 码 足 以 完成 这 项 工作 。” 然而， 对 
于 大 多 数 人 来 说 ， 并 不 会 简单 地 确信 递归 的 力量 。 人 与 生 俱 来 的 怀疑 态度 使 得 你 想 弄 清楚 这 
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解法 的 步 又 。 问 题 是 ， 即 使 是 一 个 本 章 开 始 展示 的 简单 迷宫 ， 其 解法 设计 的 完整 的 步 又 也 会 
有 很 多 ， 以 至 于 不 容易 想象 。 例 如 ， 当 解决 那个 迷宫 问题 的 方案 最 终 被 发 现时 ， 需 要 调用 
solveMaze 图 数 66 次 ， 而 solveMaze 函数 的 舱 套 又 多 达 27 层 。 如 果 你 想 去 尝试 跟踪 代 
码 运行 的 细节 ， 你 几乎 肯定 会 迷失 在 其 中 。 

如 果 还 没有 准备 好 采纳 递归 的 稳步 跳跃 ， 那 最 好 在 更 一 般 的 意义 上 跟踪 代码 的 运行 。 你 
知道 ， 程 序 第 一 次 尝试 从 方 格 向 北 移动 来 寻找 解法 ， 因 为 for 循环 是 按照 Direction 枚 
举 所 定义 的 顺序 来 遍历 所 有 方向 的 。 因 此 ， 解 决 方案 的 第 一 步 是 从 下 面 的 位 置 开始 进行 一 个 
递归 调用 : 


此 时 ， 相 同 的 过 程 再 次 发 生 了 。 程 序 再 一 次 尝试 向 北 移 动 ， 并 且 在 这 个 位 置 做 了 一 次 新 
的 递归 调用 : 


x x © 


在 这 层 递 归 中 ， 不 可 能 再 向 北 移动 了 ， 所 以 for 循环 遍历 了 其 他 方向 。 在 试图 向 南 移动 时 ， 
程序 遇 到 一 个 标记 过 的 方 格 ， 所 以 改 为 向 西 寻找 出 口 并 产生 了 一 次 新 的 递归 调用 。 相 同 的 过 
程 发 生 在 这 个 新 的 方 格 中 ， 进 而 就 导致 了 如 下 局 面 : 


在 这 个 位 置 上 ，for 循环 中 的 任何 一 个 方向 都 不 行 ;每 一 个 方 格 要 么 被 墙 堵 住 ， 要 么 
已 经 被 标记 过 。 因 此 当 这 一 级 的 for 循环 从 底部 退出 时 ， 程 序 会 解除 当前 方 格 的 标记 ， 并 
且 返 回 到 前 一 级 。 结 果 ， 这 个 位 置 上 的 所 有 路 径 也 都 被 探索 过 一 遍 ， 所 以 程序 再 次 解除 当前 
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方 格 的 标记 ， 并 回溯 到 递归 的 更 高 一 级 上 。 最 终 ， 程 序 又 回溯 到 初始 的 递归 调用 上 ， 此 时 ， 
for 循环 已 经 穷尽 了 向 北 移动 的 所 有 可 能 性 。for PHARMA, RRS, MARE 
向 南 探索 ， 在 以 下 局 面 下 开始 递归 调用 : 


从 这 里 开始 ， 相 同 的 过 程 又 接 呈 而 至 。 递 归 系 统 地 遍历 了 该 条 路 上 的 每 一 条 通道 ,一 
旦 遇 到 死胡同 就 沿 递 归 调 用 栈 原 路 返回 。 这 条 路 上 唯一 的 不 同 是 ， 最 终 ( 对 于 路 径 中 的 每 一 
步 ， 降 低 一 个 额外 的 递归 层次 后 ) 程序 在 下 面 的 位 置 进行 了 一 次 递归 调用 : 





在 这 种 情况 下 ， 特 休 斯 站 在 迷宫 外 面 ， 所 以 简单 情况 出 现 了 ， 并 返回 true 给 它 的 调用 者 。 
然后 这 个 值 会 通过 所 有 27 级 递归 调用 传递 回去 ， 最终 返回 到 主 程序 。 


9.2 ”回溯 与 游戏 


尽管 回溯 在 迷宫 情景 中 最 容易 阐明 ， 这 种 策略 却 相 当 的 普遍 。 例 如 ， 你 可 以 将 回溯 应 用 
到 大 多 数 双人 策略 游戏 中 。 一 开始 ， 第 一 个 玩家 在 移动 时 有 多 种 选择 ， 根 据 其 选择 的 移动 ， 
然后 第 二 个 玩家 有 特定 的 一 系列 响应 。 每 一 个 响应 又 会 导致 第 一 个 玩家 进行 新 的 选择 ,这 个 
过 程 将 一 直 持续 到 游戏 结束 。 在 游戏 中 ， 每 一 轮 不 同 的 可 能 的 位 置 形成 了 一 个 分 支 结 构 ， 其 
中 每 一 次 选择 都 产生 越 来 越 多 的 可 能 性 。 

如 果 你 想 让 程序 把 计算 机 作为 双人 游戏 的 一 方 ， 一 种 方法 是 让 计算 机 跟踪 所 有 可 能 的 分 
支 。 在 做 出 第 一 次 移动 之 前 ， 计 算 机 会 尝试 进行 每 一 种 可 能 的 选择 。 对 于 每 一 次 选择 ， 计 算 
机 会 紧 接着 决定 它 的 对 手 将 如 何 响应 。 为 此 计算 机 将 遵循 相同 的 逻辑 : 尝试 每 一 种 可 能 性 ， 
并 且 评 估 对 手 可 能 做 出 的 反击 。 如 果 计 算 机 能 够 有 远见 知晓 自己 做 出 某 一 步 移动 可 以 置 对 手 
于 死地 ， 那 么 将 走出 这 一 步 。 

理论 上 ， 这 个 策略 可 以 应 用 到 所 有 双人 策略 游戏 中 。 而 实际 上 ， 即 使 是 现代 的 计算 机 ， 
前 瞻 所 有 可 能 的 移动 、 对 手 潜在 的 响应 以 及 对 这 些 响 应 做 出 的 响应 等 等 ， 这 一 过 程 也 是 既 耗 
时 又 耗 内 存 的 。 然 而 ， 还 是 有 那么 几 个 游戏 很 简单 ， 它 们 可 以 通过 前 瞻 所 有 的 可 能 性 来 求 
解 ， 然 而 对 于 人 类 玩家 来 说 太 复杂 ， 不 能 立刻 找到 解法 。 
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9.2.1 拿 子 游戏 


为 了 理解 递归 回溯 如 何 应 用 到 双人 游戏 上 ， 我 们 考虑 一 个 简单 的 例子 ， 例 如 拿 子 游戏 
(Nim)， 它 是 这 一 大 类 游戏 的 泛称 。 在 这 类 游戏 中 ， 玩 家 依次 从 初始 的 布局 中 将 目标 拿 走 。 
在 这 个 特定 的 版 本 中 ， 游 戏 从 桌子 上 的 13 枚 硬币 开始 。 每 一 轮 玩家 从 中 任意 抽取 一 枚 、 两 
枚 或 三 枚 硬币 ， 并 将 其 放置 一 边 。 游 戏 的 目的 是 避免 使 自己 迫使 拿 到 最 后 一 枚 硬币 。 图 9-4 
显示 了 一 个 人 机 对 战 的 示例 。 





Welcome to the game of Nim! 
In this game, we will start with a pile of 





3 coins from the table. The player who 
takes the last coin loses. 


There are 13 coins in the pile. 
How many would you like? 2 
There are 11 coins in the pile. 
I'll take 2. t 
There are 9 coins in the pile. 
How many would you like? 3 
There are 6 coins in the pile. 
I'll take 1. 

There are 5 coins in the pile. 
How many would you like? 1 
There are 4 coins in the pile. 
I'll take 3. 

There is only one coin left. 

I win. 








9-4 拿 子 游戏 的 示例 运行 


你 该 怎样 编写 程序 去 玩 这 个 拿 子 游戏 呢 ? 这 个 游戏 的 机 械 方面 (记录 硬币 数目 ， 请 求 玩 
家 合法 地 走 子 ， 决 定 游 戏 的 结束 等 ) 组 成 了 一 个 简单 的 编程 任务 。 程 序 中 有 意思 的 部 分 包括 
如 何 给 计算 机 指明 一 个 策略 ， 使 其 演示 一 个 可 能 最 好 的 游戏 。 

为 拿 子 游戏 寻找 一 个 成 功 的 策略 并 不 特别 困难 ， 尤 其 是 ， 如 果 你 从 游戏 的 结束 点 往 回 考 
虑 的 话 。 拿 子 游戏 的 潜 规 则 是 拿 到 最 后 一 枚 硬币 的 玩家 是 输家 。 因 此 ， 如 果 你 发 现 桌 子 上 仅 
剩 一 枚 硬币 在 等 着 你 ， 那 可 就 糟 啦 : 你 不 得 不 取 走 它 并 且 认 输 。 反 之 ， 如 果 还 有 两 枚 ， 三 枚 
或 者 四 枚 ， 那 将 是 极 好 的 ， 如 果 你 遇 到 其 中 任何 一 种 情况 ， 你 往往 可 以 拿 走 一 部 分 硬币 ， 仅 
剩 一 枚 硬币 ， 让 你 的 对 手 不 得 不 拿 走 最 后 一 枚 硬币 。 

但 是 假设 桌子 上 还 有 五 枚 硬币 呢 ? 那么 你 该 怎么 办 ? 稍 加 思索 ， 就 很 容易 发 现在 这 种 情 
况 下 ， 你 也 是 要 输 的 。 无 论 你 怎么 做 ， 你 都 不 得 不 留 给 对 手 两 枚 、 三 枚 或 四 枚 硬币 一 一 从 对 
手 角度 考虑 ， 你 会 发 现 局 势 是 有 利 的 。 如 果 对 手 还 算 机 智 的 话 ， 下 一 轮 桌 子 上 肯定 只 剩 一 枚 
硬币 等 着 你 。 既 然 你 没有 好 棋 可 走 ， 那 么 面 对 五 枚 硬币 也 是 一 种 明显 不 利 的 局 势 。 

这 种 非 正式 的 分 析 揭 示 了 拿 子 游戏 的 一 个 重要 规则 。 在 每 一 轮 游戏 中 ， 你 要 去 寻找 一 步 
好 棋 。 好 棋 的 意思 就 意味 着 置 对 手 于 不 利 处 境 。 但 是 什么 又 是 不 利 处 境 呢 ?” 那 就 是 没有 好 棋 
可 走 的 局 面 。 

即使 对 于 好 棋 和 不 利 处 境 的 定义 看 起 来 好 像 是 个 循环 ,但 是 它们 仍然 组 成 了 玩 一 个 
完美 的 双人 游戏 的 完整 策略 。 只 是 你 必须 得 借助 递归 的 力量 。 如 果 你 有 一 个 函数 find 
GoodMove, 该 函数 将 硬币 数 作为 参数 ， 它 必须 做 的 是 尝试 每 一 种 可 能 性 ， 寻 找 置 对 手 
于 不 利 处 境 的 走 法 。 你 可 以 将 决定 一 个 特定 的 情形 是 否 是 不 利 的 工作 分 派 给 判断 函数 
isBadPosition, 该 函数 调用 findGoodMove 来 观察 是 否 有 一 个 不 利 的 处 境 。 这 两 个 方法 
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一 来 一 往 相互 调用 ， 评 估 游 戏 过 程 中 所 有 可 能 的 分 支 。 
findGoodMove fll isBadPosition 这 两 个 相互 递归 的 函数 提供 了 拿 子 游戏 程序 进行 
完美 游戏 的 全 部 策略 。 为 了 完成 这 个 程序 ， 你 所 要 做 的 就 是 编码 和 人 类 玩家 进行 游戏 的 机 
制 。 这 部 分 代码 对 于 创建 游戏 、 输 出 指令 、 记 录 该 谁 走 子 、 请 求 玩 家 走 子 、 检 查 走 子 是 否 合 
法 、 更 新 金币 数目 、 判 断 游 戏 何 时 结束 、 通 知 玩家 输赢 情况 都 是 至 关 重 要 的 。 
尽管 这 些 任 务 概 念 上 并 不 是 很 难 ， 但 是 拿 子 游戏 这 个 应 用 程序 非常 之 大 ， 并 且 采 用 了 
6.5 节 所 描述 的 实现 策略 ， 其 中 ， 程 序 定义 为 一 个 类 而 不 是 一 个 自由 函数 的 集合 。 图 9-5 JE 
示 了 拿 子 游戏 采用 这 种 设计 的 一 个 实现 。 游 戏 的 代码 被 封装 在 一 个 称 之 为 SimpleNim 的 类 
中 ， 其 中 有 两 个 实例 变量 来 记录 玩 游戏 的 过 程 : 
e 一 个 记录 桌子 上 剩余 硬币 数目 的 整数 变量 ncoins. 
e 变量 whoseTurn 指出 哪个 玩家 该 走 子 了 。 变 量 的 值 存储 在 枚 举 类 型 player 中 ， 
它 定义 了 常量 HUMAN 和 COMPUTER。 在 每 一 轮 的 结束 ，play 方法 的 代码 通过 将 
whoseTurn 的 值 赋 给 opponent (whoseTurn) 将 顺序 传 给 下 一 位 玩家 。 


/* 
* File: Nin.cpp 
* This program simulates a simple variant of the game of Nim. In this 
* version, the game starts with a pile of 13 coins on a table. Players 
* then take turns removing 1, 2, or 3 coins from the pile. The player 
* who/takes the last coin loses. 


*/ 


finclude <iostream> 
#include <string> 
#include "error.h" 
#include "simpio.h" 
#include "strlib.h" 
using namespace std; 


/* Constants */ 

const int N_COINS = 13; /* Initial number of coins */ 
const int MAX MOVE = 3; /* Number of coins a player may take +7 
const int NO GOOD MOVE = -1; /* Marker indicating there is no good move */ 


/ 


* 
* Type: Player 


* This enumerated type differentiates the human and computer players. 


*/ 
enum Player { HUMAN, COMPUTER }; 


/* 

* Method: opponent 
* Usage: Player other = opponent (player); 

* 

* Returns the opponent of the player. The opponent of the computer 
* is the human player and vice versa. 

ay 
Player opponent (Player player) ( 

return (player == HUMAN) ? COMPUTER : HUMAN; 

) 
/* 

* Constant: STARTING PLAYER 


* Indicates which player should start the game. 
*/ 





const Player STARTING PLAYER - HUMAN; 


图 9-5 Nim.cpp 的 实现 
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/* 


* Class: SimpleNim 


* The SimpleNim class implements the simple version of Nim. 
*y 


class SimpleNim { 


public: 


/* 
* Method: play 
Usage: game.play(); 


Plays one game of Nim with the human player. 
ey 


void play() ( 
nCoins - N COINS; 
whoseTurn - STARTING PLAYER; 
while (nCoins > 1) ( 
cout «« "There are " «« nCoins «« " coins in the pile." «« endl; 
if (whoseTurn -- HUMAN) ( 
nCoins -= getUserMove(); 
] else ( 
int nTaken = getComputerMove(); 
cout «« "I'll take " «« nTaken «« "." «« endl; 
nCoins -- nTaken; 
) 


whoseTurn = opponent (whoseTurn); 


) 


announceResult (); 


* Method: printInstructions 
Usage: game.printInstructions(); 


Explains the rules of the game to the user. 


wg 


void printInstructions() { 
cout "Welcome to the game of Nim!" << endl; 
cout "In this game, we will start with a pile of" << endl; 
cout N COINS «« " coins on the table. On each turn, you" «« endl; 
cout "and I will alternately take between 1 and" «« endl; 
cout MAX MOVE «« " coins from the table. The player who" «« endl; 
cout "takes the last coin loses." «« endl «« endl; 


) 


private: 


/* 
Method: getComputerMove 
Usage: int nTaken = getComputerMove(); 


Figures out what move is best for the computer player and returns 

the number of coins taken. The method first calls findGoodMove 

to see if a winning move exists. If none does, the program takes 
only one coin to give the human player more chances to make a mistake. 


/ 


int getComputerMove() ( 
int nTaken - findGoodMove (nCoins); 
return (nTaken == NO GOOD MOVE) ? 1 : nTaken; 


Method: findGoodMove 
Usage: int nTaken - findGoodMove (nCoins); 


Looks for a winning move, given the specified number of coins. 
* If there is a winning move in the current position, the method 
* returns that value; if not, the method returns the constant 
* NO GOOD MOVE. This method depends on the recursive insight that 





图 9-5 (5) 
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* a good move is one that leaves your opponent in a bad position 
* a bad position is one that offers no good moves. 


wf 


int findGoodMove (int nCoins) { 
int limit = (nCoins < MAX MOVE) ? nCoins : MAX MOVE; 
for (int nTaken = 1; nTaken <= limit; nTaken++) { 
if (isBadPosition(nCoins - nTaken)) return nTaken; 
) 
return NO GOOD MOVE; 


Method: isBadPosition 
if (isBadPosition(nCoins)) 


Returns true if nCoins represents a bad position. 

及 bad position is one in which there is no good move. 
Being left with a single coin is clearly a bad position 
and represents the simple case of the recursion. 


/ 


bool isBadPosition(int nCoins) ( 
if (nCoins == 1) return true; 
return findGoodMove(nCoins) == NO GOOD MOVE; 


Method: getUserMove 
Usage: int nTaken - getUserMove(); 


Asks the user to enter a move and returns the number of coins taken 
If the move is not legal, the user is asked to reenter a valid move 


int getUserMove() { 


while (true) ( 
int nTaken = getInteger("How many would you like? "); 
int limit = (nCoins < MAX MOVE) ? nCoins : MAX MOVE; 
if (nTaken » O && nTaken «- limit) return nTaken; 
cout «« "That's cheating! Please choose a number"; 
cout << " between 1 and " << limit << "." << endl; 
cout «« "There are " «« nCoins «« " coins in the pile." «« endl; 


Method: announceResult 
Usage: announceResult(); 


Announces the final result of the game. 
*/ 
void announceResult() ( 
if (nCoins -- O) ( 
cout «« "You took the last coin. You lose." «« endl; 
) else { 
cout << "There is only one coin left." << endl; 
iff (whoseTurn == HUMAN) { 
cout << "I win." << endl; 
) else ( 
cout «« "I lose." «« endl; 


) 
) 


/* Instance variables */ 


int nCoins; /* Number of coins left on the table */ 


图 9-5 ( 续 ) 
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Player whoseTurn; /* Marker showing whose turn it is 
}; 
/* Main program */ 


int main() { 
SimpleNim game; 


game.printInstructions(); 
game.play(); 
return 0; 





图 9-5 (48) 


9.2.2 一 个 通用 的 双人 游戏 程序 


图 9-5 中 的 代码 是 特别 针对 拿 子 游戏 的 。 例 如 ，play 方 法 直接 关系 到 建立 变量 
nCoins， 并 在 每 一 次 玩家 走 子 后 对 其 进行 更 新 。 然 而 ， 双 人 游戏 的 一 般 结构 有 着 更 为 广泛 
的 应 用 。 即 使 不 同 的 游戏 要 求 不 同 的 实现 去 完善 细节 ， 许 多 游戏 仍 可 以 通过 使 用 全 局 策略 得 
到 解决 。 

本 书 的 关键 概念 就 是 抽象 (abstraction)， 它 是 将 一 个 问题 的 一 般 性 质 分 离 出 来 的 过 程 ， 
从 而 使 人 不 至 于 迷失 在 特定 领域 的 诸多 细节 当中 。 你 可 能 对 编写 一 个 拿 子 游戏 的 程序 并 不 
是 很 感 兴趣 ; 毕竟 ， 这 确实 是 一 个 十 足 无 聊 的 游戏 。 你 真正 感 兴趣 的 可 能 是 编写 一 个 更 加 
普遍 的 程序 ， 它 可 以 应 用 于 拿 子 游戏 、 三 联 横 游戏， 或 者 其 他 任何 一 种 你 选择 的 双人 策略 
游戏 。 

创建 这 样 一 种 通用 机 制 的 动机 来 自 于 这 样 一 个 事实 : 大 多 数 游 戏 共享 一 部 分 基础 概 
念 。 第 一 个 这 样 的 概念 就 是 状态 (state) 。 对 于 任何 一 种 游戏 ， 都 会 有 一 些 数据 值 准 确 记 
录 任 何 时 间 点 发 生 了 什么 。 例 如 在 拿 子 游戏 中 ， 其 状态 包括 它 的 两 个 实例 变量 ncoins 和 
whoseTurn 的 值 。 而 对 于 象棋 这 种 游戏 ， 其 状态 需要 包括 棋子 当前 被 放 在 哪个 格子 里 ， 尽 
管 它 大 概 也 包括 whoseTurn 变量 ， 或 者 其 他 实现 相同 功能 的 一 些 东 西 。 然 而 ， 对 于 任何 一 
种 双人 游戏 ， 它 都 应 该 存储 实现 这 个 游戏 的 类 的 变量 中 的 相关 数据 。 

第 二 个 重要 的 概念 是 走 子 ( move)。 在 拿 子 游戏 中 ， 每 次 走 子 都 会 产生 一 个 代表 被 拿 走 
的 硬币 数目 的 整数 。 在 国际 象棋 中 ， 每 一 次 走 子 都 会 产生 表示 移动 棋子 的 起 点 和 终点 的 坐标 
对 ， 尽 管 这 种 方法 事实 上 会 因 “ 王 车 易 位 ”或 “ 兵 生变 ”的 高 招 而 变 得 复杂 。 然 而 ， 对 于 任 
何 游戏 ， 都 可 以 定义 一 个 Move 类 型 ， 该 类 型 用 来 封装 在 游戏 中 需要 呈现 走 子 的 任何 信息 。 

尽管 第 一 眼看 Move 应 该 被 定义 成 一 个 类 ,但 这 样 做 的 话 会 带 来 额外 的 开销 ,降低 了 代 
码 的 可 读 性 。 随 之 而 来 的 问题 是 类 中 的 成 员 默 认 的 能 见 度 为 私有 ， 它 意味 着 实现 这 个 游戏 的 
类 不 能 访问 这 些 声 明 为 私有 的 成 员 。 

你 可 以 采用 以 下 几 种 策略 来 解决 这 个 问题 。 一 种 策略 是 将 Move 定义 成 一 个 类 ,但 是 将 
其 实例 变量 声明 为 公有 的 。 然 而 ， 这 种 策略 违背 了 本 书 使 用 的 一 条 规则 ， 即 实例 变量 不 能 出 
现在 公有 部 分 。 第 二 种 策略 是 以 第 6 章 类 的 风格 来 定义 getter 和 setter 方法 。 这 种 策 
略 符合 现代 面向 对 象 编程 ， 但 同时 使 得 类 Move 变 得 更 难 使 用 。 对 于 一 个 类 而 言 ， 复 杂 性 无 
法 保障 用 户 对 类 的 有 效 使 用 ， 其 用 户 可 能 是 仅 为 实现 游戏 的 类 。 第 三 种 策略 是 将 Move 类 声 
明 为 游戏 类 的 友 元 。 第 四 种 策略 是 将 Move 定义 为 一 个 结构 类 型 而 不 是 一 个 类 。 从 某 种 意义 


上 说 ， 这 样 做 将 会 使 其 实例 变量 声明 为 公有 的 ， 但 是 事实 上 Move 声明 为 结构 类 型 充当 了 一 
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个 警告 ， 即 在 整个 游戏 代码 的 上 下 文中 ， 它 只 应 该 被 用 到 与 游戏 有 关 的 地 方 。 
本 书 采用 了 最 后 一 种 策略 ， 也 就 意味 着 Move 类 型 应 该 如 下 所 示 : 


struct Move { 
int nTaken; 
i 
— ERA f — Move 类 型 ， 你 就 可 以 定义 一 些 额 外 的 辅助 方法 ， 它 允许 你 可 像 以 下 这 样 重 
写 play 方法 : 
void play() { 
initGame(); 
while (!gameIsOver()) ( 
displayGame(); 
if (getCurrentPlayer() == HUMAN) ( 
makeMove (getUserMove()); 
) else { 
Move move = getComputerMove() ; 
displayMove (move); 
makeMove (move) ; 
) 
switchTurn(); 
) 
announceResult(); 


) 


最 重要 的 一 点 是 ，play 方法 的 实现 代码 并 没有 给 出 玩 的 是 什么 游戏 。 它 也 许 是 拿 子 游戏 ， 
但 是 也 可 能 仅仅 是 其 他 较 容易 的 游戏 。 每 一 个 游戏 需要 自己 定义 一 个 Move 类 型 ， 以 及 各 种 
基于 游戏 的 方法 ， 例 如 initGame 和 makeMove 的 特定 实现 。 尽 管 如 此 ，play 方法 的 结 
构 一 般 足 以 适用 于 许多 不 同 的 双人 游戏 。 

如 果 你 把 play 的 一 般 实现 和 图 9-5 的 代码 进行 比较 ， 你 会 注意 到 转换 顺序 的 代码 通过 
辅助 方法 getCurrentPlayer 和 switchTurn 已 经 包含 在 一 般 结 构 中 。 做 出 这 种 改变 意 
味 着 play 方法 不 再 直接 涉及 实例 变量 ， 而 是 通过 调用 方法 来 完成 工作 。 这 个 策略 允许 底层 
实现 更 加 灵活 。 

SRM, play 方法 以 及 实现 轮流 的 机 制 并 不 是 编写 一 个 双人 游戏 最 有 趣 的 部 分 。 算 法 上 
最 有 趣 的 部 分 其 实 已 经 嵌入 到 了 方法 getComputerMove 中 ， 它 负责 为 计算 机 选择 最 好 的 
走 子 策略 。 图 9-5 的 拿 子 游戏 版 本 利用 findGoodMove fll isBadPosition 两 个 方法 的 相 
互 递归 调用 实现 了 这 种 策略 ， 这 两 个 方法 在 当前 状态 会 遍历 所 有 可 能 的 选择 来 找到 一 个 最 佳 
的 走 子 。 既 然 此 策略 也 是 独立 于 任何 特定 游戏 的 细节 之 外 ， 因 此 我 们 应 该 可 以 使 用 一 种 更 一 
般 的 方式 编写 这 些 方法 。 然 而 ， 在 进一步 深入 之 前 ， 将 问题 变 得 更 一 般 化 是 很 有 帮助 的 ， 这 
样 也 能 使 程序 适用 于 更 多 的 游戏 。 


9.3 最 小 最 大 算法 

之 前 章节 所 描述 的 技巧 ， 对 于 像 拿 子 游戏 这 样 简单 、 完 全 可 解 的 游戏 非常 有 用 。 但 是 随 
着 游戏 变 得 更 加 复杂 ， 程 序 不 可 能 去 检验 每 一 种 可 能 的 输出 。 例 如 ， 如 果 你 想 尝 试 国际 象棋 
每 一 种 可 能 的 走 法 ， 即 使 以 现代 计算 机 的 运算 速度 ， 也 要 花 上 几 十 亿 年 。 然 而 ， 不 顾 这 些 限 
制 的 话 ， 计 算 机 还 是 很 擅长 国际 象棋 的 。1997 年 ，IBM 的 “深蓝 ”超级 计算 机 就 曾 打败 了 
当时 的 世界 冠军 一 加 里 . 卡 斯 帕 罗 夫 。“ 深 蓝 ” 并 没有 对 所 有 可 能 游戏 走 法 进行 穷尽 的 分 
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析 ， 而 是 仅仅 前 瞻 了 有 限 数量 的 走 法 ， 这 在 很 大 程度 上 与 人 类 相似 。 

即使 对 于 游戏 来 说 ， 遍 历 所 有 可 能 的 一 系列 走 法 也 是 不 可 行 的 ， 但 是 在 拿 子 游 戏 中 ， 关 
于 好 的 走 法 和 坏 的 处 境 的 递归 概念 仍然 能 派 上 有 用场。 尽管 也 许 不 可 能 像 万 无 一 失 的 赢家 一 样 
确定 某 一 步 走 法 ， 但 是 一 个 仍 正确 的 事实 是 : 任何 处 境 下 最 好 的 走 法 就 是 能 够 将 你 的 对 手 置 
于 最 坏处 境 的 走 法 。 类 似 地， 最 坏 的 处 境 也 就 是 使 你 的 对 手 使 不 出 高 招 。 这 种 策略 〈 它 包括 
寻找 一 种 情况 ， 能 够 让 对 手 难 使 高 招 ) 被 称 为 最 小 最 大 (minimax) 算法 ， 因 为 其 目的 就 是 
寻找 一 种 走 法 将 对 手 最 大 的 机 会 最 小 化 。 


9.3.1 游戏 树 


可 视 化 最 小 最 大 策略 的 最 好 方法 就 是 形成 每 一 轮 的 分 支 图 来 考虑 游戏 中 的 可 能 走 法 。 由 
于 这 种 分 支 结构 ， 这 样 的 图 被 称 为 游戏 树 ( game tree)。 初 始 状 态 由 游戏 树 顶端 的 点 来 表示 。 
例如 ， 如 果 存 在 从 这 个 位 置 开始 的 三 种 可 能 的 走 法 ,那么 将 会 从 当前 状态 向 新 状态 引出 三 条 


线 ， 如 下 图 所 示 : 


从 每 一 个 新 位 置 ， 你 的 对 手 也 会 有 多 种 选择 。 如 果 每 一 个 位 置 又 可 以 有 三 种 选择 ， 那 么 下 一 
阶段 的 游戏 树 如 下 图 所 示 : 


从 初始 位 置 开始 你 会 选择 哪 种 走 法 呢 ? 显然 ， 你 的 目标 是 取得 最 好 的 结果 。 遗 憾 的 是 ， 
你 只 能 控制 游戏 的 一 半 。 如 果 你 能 够 像 选择 自己 走 法 一 样 也 能 选择 对 手 的 走 法 ， 你 就 可 以 在 
两 轮 之 后 使 自己 处 于 最 佳 位 置 。 鉴 于 你 的 对 手 也 想 赢 ， 所 以 最 好 的 方法 是 尽量 选择 让 对 手 赢 
的 机 会 最 小 的 那 步 棋 。 


9.3.2 评价 位 置 和 走 法 


为 了 理解 你 如 何 能 从 一 个 特定 的 位 置 寻找 最 佳 走 法 ， 加 入 一 些 定量 的 数据 进行 分 析 是 
很 有 帮助 的 。 如 果 可 以 为 每 种 可 能 的 走 法 分 配 一 个 数值 得 分 ， 那 么 判断 一 种 走 法 比 另 一 种 是 
否 更 好 将 会 更 简单 。 分 值 越 高 ， 走 法 越 好 。 因 此 得 分 为 十 7 的 走 法 比 得 分 为 -4 的 走 法 要 好 。 
除了 为 每 一 种 可 能 的 走 法 评分 ， 也 有 必要 为 游戏 中 的 每 个 位 置 进行 评分 。 因 此 ， 一 个 得 分 为 
十 9 的 位 置 比 一 个 得 分 为 十 2 的 位 置 要 好 。 

位 置 和 走 法 都 是 从 走 棋 玩 家 的 角度 进行 评分 的 。 而 且 ， 评 级 系统 是 关于 以 0 对 称 来 设计 
的 ， 也 就 是 说 ， 当 前 玩家 得 分 为 十 9 的 位 置 在 其 对 手眼 里 则 是 -9 的 位 置 。 这 个 评分 的 解释 
正 是 抓 住 了 一 种 思想 ， 即 一 个 玩家 好 的 位 置 对 另 一 个 玩家 来 说 则 是 坏 的 位 置 。 正 如 在 拿 子 游 
戏 中 的 情形 一 样 。 更 重要 的 是 ， 用 这 种 方法 定义 一 个 评估 系统 很 容易 表达 位 置 得 分 和 走 法 得 
分 之 间 的 关系 。 任 何 一 步 走 法 的 得 分 都 是 从 对 手眼 里 看 到 的 相反 数 。 类 似 地 ， 任 何 位 置 的 得 
分 都 可 以 定义 为 最 佳 走 法 的 得 分 。 
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为 了 使 这 种 论述 更 具体 ， 考 虑 一 个 简单 的 例子 是 很 有 帮助 的 。 假 设 你 在 游戏 中 可 以 前 瞻 
两 步 棋 ,包括 你 的 一 步 走 法 和 对 手相 应 的 可 能 的 一 步 走 法 。 在 计算 机 科学 中 ,为 了 避免 和 单 
词 “move” 以 及 “turn” 产 生 二 义 性 ， 单 个 游戏 者 的 单个 动作 被 称 作 ply， 它 有 时 表示 两 个 
玩家 都 有 玩 的 机 会 。 如 果 在 评估 了 两 个 ply 之 后 的 位 置 ， 那 么 游戏 树 可 能 如 下 图 所 示 : 


doa .-3 244 X b o3 

因为 树 底部 的 处 境 是 树 顶 部 的 处 境 的 一 种 可 能 你 不 得 不 走 子 ， 因 此 这 些 位 置 的 评分 都 是 
从 你 的 角度 确定 的 。 给 出 这 些 潜在 位 置 的 评分 ， 从 最 初 的 布局 开始 ， 你 该 如 何 走 子 呢 ? 

乍 一 看 ， 你 可 能 被 中 间 那 个 十 9 的 分 支 所 吸引 ， 它 对 于 你 来 说 是 一 个 很 好 的 结果 。 遗 
RIE, 虽然 中 间 的 分 支 给 出 了 如 此 不 错 的 结果 ,但 这 并 不 是 真 的 重要 。 如 果 你 的 对 手 很 
理智 , 那么 游戏 不 可 能 到 达 十 9 的 位 置 。 例 如 ， 假 如 你 真 的 选择 了 中 间 的 分 支 ， 给 出 所 有 可 
能 的 选择 ， 那 么 你 的 对 手 将 会 选择 最 左边 那个 -5 的 分 支 ， 也 就 是 下 面 游戏 树 中 粗 线 标记 的 
a X: 





*7 +6 -9 -5 +9 -4 =] +l -2 
你 最 初 的 选择 使 你 处 于 这 样 一 个 位 置 (从 你 的 角度 )， 得 分 为 -<5。 你 最 好 选择 最 右边 的 分 支 ， 
这 样 你 的 对 手 最 好 的 策略 也 就 使 你 的 处 境 得 分 变 为 -2: 


+7 46 -9 -5 +9 -4 -1 4d -2 
正如 在 这 一 节 前 面 所 提 到 的 ， 从 对 手 的 角度 来 看 ， 走 法 的 评分 是 自身 位 置 的 相反 数 。 游 
戏 树 中 粗 线 标记 的 最 后 一 步 的 评分 是 十 2， 因 为 它 会 使 对 手 处 于 一 个 -2 的 位 置 。 负 号 表示 角 
度 的 转换 。 能 够 使 对 手 处 于 不 利 位 置 的 走 法 对 你 来 说 是 很 好 的 ， 反 之 亦 然 。 每 一 个 位 置 的 评 
分 都 是 它 提供 的 最 好 走 法 的 评分 。 因 此 ， 关 于 位 置 和 走 法 的 评分 以 及 粗 线 标记 的 路 径 如 下 图 
所 示 : 


从 对 手 的 
角度 评分 
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因此 ， 初 始 位 置 的 评分 是 -2。 尽 管 这 个 位 置 并 不 那么 理想 ， 但 假设 你 的 对 手 思路 理智 ， 这 
比 起 其 他 可 能 的 结果 对 你 来 说 算 好 的 了 。 
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接 下 来 会 在 本 章 概 述 最 小 最 大 算法 的 实现 ， 其 中 表示 评分 的 值 是 整数 ， 它 必须 落 在 以 下 


两 个 常量 之 间 : 

const int WINNING POSITION = 1000; 

const int LOSING POSITION = -WINNING POSITION; 
在 游戏 的 结尾 ， 位 置 的 得 分 可 以 根据 谁 获胜 来 确定 。 任 何 位 置 的 评分 结果 并 不 一 定 要 规定 是 
一 个 处 于 这 两 个 常量 之 间 的 整数 。 


9.3.3 ”限制 递归 搜索 的 深度 


如 果 你 能 从 一 个 游戏 一 开始 搜索 并 得 到 每 一 种 可 能 的 结果 ， 基 本 上 就 可 以 利用 之 前 拿 
子 游戏 的 结构 来 实现 最 小 最 大 算法 了 。 你 需要 两 个 相互 递归 的 函数 ， 一 个 用 来 寻找 最 好 的 走 
法 ， 另 一 个 则 用 来 评估 位 置 。 对 于 非常 复杂 的 游戏 ， 程 序 是 不 可 能 在 合理 的 时 间 范 围 内 搜索 
整 棵 游戏 树 的 。 因 此 ， 最 小 最 大 算法 一 个 比较 实际 的 实现 必须 规定 搜索 在 某 个 确定 点 结束 。 

约束 搜索 常见 的 策略 是 为 递归 深度 设置 某 个 最 大 值 。 例 如 ， 你 可 以 规定 当 每 个 玩家 走 
五 步 之 后 终止 递归 ， 两 个 玩家 就 是 十 步 。 如 果 游 戏 在 约束 条 件 到 达 之 前 结束 ， 你 可 以 通过 

412] 检测 观察 谁 启 得 比赛 来 评估 最 后 的 位 置 ， 然 后 视 情 况 而 定 返 回 WINNING_POSITION 或 
LOSING_POSITION。 

但 是 如 果 在 游戏 结束 之 前 ， 你 已 经 到 达 递 归 约 束 条 件 ， 会 发 生 什么 呢 ? 此 时 ， 你 需要 借 
助 其 他 一 些 不 会 额外 进行 递归 调用 的 方法 来 评估 位 置 。 鉴 于 这 种 分 析 方法 只 依赖 于 当前 游戏 
的 状态 ， 它 通常 被 称 为 静态 分 析 (static analysis) 。 例 如 ， 在 国际 象棋 的 程序 中 ， 静 态 分 析 
则 表现 在 会 根据 双方 棋盘 中 的 棋子 进行 简单 的 计算 。 如 果 玩 家 的 走 法 不 在 计算 范围 之 内 ， 那 
么 他 的 位 置 有 一 个 正 的 评分 ， 如 果 不 是 ， 评 分 是 负 的 。 

尽管 任何 简单 的 计算 都 免不了 要 忽视 一 些 重要 的 因素 ， 但 是 牢记 静态 分 析 只 能 在 达到 递 
归 终 止 条 件 时 进行 是 很 重要 的 。 例 如 ， 如 果 有 一 种 玩法 能 在 没 走 几 步 之 后 取胜 ， 那 么 这 和 着 
态 分 析 无 关 ， 因 为 递归 分 析 会 在 进入 静态 分 析 阶 段 之 前 找到 赢得 比赛 的 玩法 。 

在 最 小 最 大 算法 的 实现 中 加 入 一 个 深度 约束 最 简单 的 方法 是 让 每 一 个 递归 函数 都 有 一 个 
名 为 depth 的 参数 ， 它 用 来 记录 到 目前 为 止 进行 过 多 少 级 分 析 ， 并 在 对 下 一 个 处 境 进行 评 
分 之 前 使 其 值 加 1。 如 果 参 数值 大 于 定义 的 常量 MAX_DEPTH， 那 么 必须 用 静态 分 析 来 继续 
进行 更 深层 次 的 评估 。 


9.3.4 实现 最 小 最 大 算法 


最 小 最 大 算法 可 以 通过 使 用 两 个 相互 递归 调用 的 函数 来 实现 : findBestMove 和 
evaluatePosition, 它们 显示 在 图 9-6 中 。findBestMove 方法 考虑 每 一 种 可 能 的 走 
法 ， 然 后 在 产生 的 位 置 处 调用 evaluatePosition， 寻 找 一 个 在 对 手 角度 看 来 评分 最 低 的 
位 置 。evaluatePosition 方法 用 findBestMove 来 确定 最 好 的 走 法 ， 然 后 返回 该 走 法 
的 评分 ， 除非 递 归 约 束 条 件 或 者 游戏 状态 需要 用 到 静态 分 析 。 

正如 你 从 图 9-6 中 的 代码 所 看 到 的 ，findBestMove 函数 以 两 种 形式 存在 。 第 一 种 形式 
无 参数 ,并且 由 用 户 调用 来 寻找 当前 位 置 最 好 的 走 法 。findBestMove 的 递归 调用 采用 第 二 
种 形式 ， 它 有 两 个 参数 。 第 一 个 参数 表示 递归 的 深度 ， 正 如 前 面 章 节 所 描述 的 ， 它 使 得 算 
法 能 够 在 一 个 确定 数量 的 走 法 之 后 终止 计算 。 第 二 个 参数 是 一 个 引用 参数 rating， 它 允许 

findMove 函数 将 最 佳 走 法 的 评分 返回 给 evaluatePosition MAM. 
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Method: findBestMove 
Usage: Move move = findBestMove(); 
Move move - findBestMove(depth, rating); 


Finds the best move for the current player and returns that move as the 
value of the function The second form is used for later recursive calls 
and includes two parameters. The depth parameter is used to limit the 
depth of the search for games that are too difficult to analyze. The 
reference parameter rating is used to store the rating of the best move. 


/ 


Move findBestMove() ( 
int rating; 
return findBestMove(0, rating); 


) 


Move findBestMove(int depth, int & rating) ( 
Vector«Move» moveList; 
Move bestMove; 
int minRating = WINNING POSITION + 1; 
generateMoveList (moveList); 
if (moveList.isEmpty()) error("No moves available"); 
for (Move move : moveList) ( 
makeMove (move) ; 
int moveRating = evaluatePosition(depth + 1); 
if (moveRating < minRating) { 
bestMove - move; 
minRating - moveRating; 
) 
retractMove (move); 
) 
rating - -minRating; 
return bestMove; 


/* 
* Method: evaluatePosition 
* Usage: int rating = evaluatePosition (depth); 


Evaluates a position by finding the rating of the best move starting at 
that point The depth parameter is used to limit the search depth. 


int evaluatePosition(int depth) ( 
if (gamelsOver() || depth »- MAX DEPTH) ( 
return evaluateStaticPosition(); 
) 
int rating; 
findBestMove (depth, rating); 
return rating; 


图 9-6 最 小 最 大 算法 的 一 般 实现 


图 9-6 中 的 代码 调用 了 几 个 方法 (每 个 方法 都 独立 于 一 个 特定 的 游戏 而 进行 编码 )， 所 以 
值得 更 深入 的 解释 : 


generateMoveList 方法 使 用 当前 状态 的 合法 走 法 填充 矢量 moveList。 
makeMove 和 retractMove 方法 分 别 用 来 实现 走 法 和 撤销 一 个 特定 的 走 法 。 这 
两 种 方法 允许 程序 尝试 一 种 潜在 的 走 法 ， 评 估 产 生 的 位 置 ， 然 后 返回 到 原来 的 
状态 。 

isGameOver 方法 用 来 检测 游戏 是 否 达到 最 后 的 状态 ， 在 这 个 状态 ， 程 序 不 可 能 进 
行 更 深 的 分 析 。 

evaluateStaticPosition 方法 用 来 在 不 进行 任何 进一步 递归 调用 的 情况 下 评估 
一 个 特定 的 状态 。 
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本 章 小 结 


本 章 通 过 迷宫 游戏 和 双人 对 战 游戏 ， 你 已 经 学 会 了 当 寻 求 某 一 目标 时 ， 如 何 作出 一 系列 
的 选择 来 解决 问题 。 基 本 的 策略 是 编写 一 个 程序 ， 当 某 种 选择 导致 无 路 可 走时 ， 它 可 以 回 湖 
到 上 一 个 决策 点 。 然 而 ， 利 用 递归 的 力量 ， 你 可 以 避免 对 回溯 过 程 的 细节 进行 编码 ， 并 且 能 
开发 出 对 很 多 问题 领域 都 适用 的 一 般 的 解决 策略 。 

本 章 的 重点 包括 : 

© 采用 下 面 的 递归 方法 ， 你 可 以 解决 大 多 数 需 要 回溯 的 问题 : 


如 果 你 已 经 求 得 解 ， 报 告 成 功 。 
for (在 当前 位 置 对 于 每 一 种 可 能 的 选择 ) { 
做 出 一 种 选择 ， 并 沿 着 该 路 径 执 行 一 步 。 
从 新 的 位 置 采用 递归 来 求解 这 个 问题 。 
如 果 递 归 调 用 成 功 ， 报告 下 一 个 更 高 层次 的 递归 调用 的 成 功 。 
否则 ， 回 退 到 当前 的 选择 以 恢复 之 前 的 程序 状态 。 


e 一 个 回溯 问题 中 完整 的 递归 调用 的 历史 (即使 是 相对 简单 的 应 用 程序 ) 在 细节 上 也 是 
难以 理解 。 对 于 涉及 多 次 回溯 的 问题 ， 接 受 递归 的 稳步 跳跃 是 很 重要 的 。 

e 在 双人 游戏 中 ， 通 过 采用 一 种 递归 回溯 的 方法 ， 你 总 能 找到 一 条 取胜 的 策略 。 因 为 
这 类 游戏 的 目标 涉及 最 小 化 对 手 取胜 的 机 会 ， 这 种 传统 的 策略 被 称 为 最 小 最 大 算法 。 


复习 题 

1. 回 淹 算 法 的 主要 特征 是 什么 ? 

2. 用 自己 的 话 来 陈述 用 于 逃离 迷宫 的 右手 法 则 。 左 手法 则 也 能 达到 相同 的 效果 吗 ? 

3. 用 递归 回溯 算法 解决 迷宫 问题 的 核心 是 什么 ? 

4. 在 solveMaze 的 递归 实现 中 ， 简 单 情 况 是 什么 ? 

5. 当 你 穿越 迷宫 时 ， 为 什么 标记 方 格 很 重要 ?如 果 你 不 标记 任何 方 格 ， 那么 solveMaze 函数 会 出 现 
什么 情况 ? 

6. TE solveMaze 实现 的 for 循环 结尾 调用 unmarksquare 的 目的 是 什么 ? 这 条 语句 对 于 算法 重 
要 吗 ? 

7. solvemaze 返回 的 布尔 结果 的 作用 是 什么 ? 

8. 用 自己 的 话 解 释 一 下 ， 在 solveMaze 的 递归 实现 中 ， 回 溯 过 程 是 如 何 发 生 的 ? 

9. 在 简单 的 拿 子 游戏 中 ， 开 始 时 共 13 枚 硬币 ， 人 类 玩家 先 走 第 一 步 。 这 是 一 个 有 利 的 位 置 还 是 不 利 的 
位 置 ， 为 什么 ? 

10. 编写 一 个 基于 ncoins 值 的 简单 的 C++ 程序 ， 位 置 对 当前 玩家 有 利 时 ，nCoins Kl true, Ail 

返回 false. 

11. 什么 是 最 小 最 大 算法 ? 它 的 名 字 有 什么 意义 ? 

12. 为 什么 开发 一 个 最 小 最 大 算法 的 抽象 实现 ， 并 且 不 依赖 于 特定 游戏 细节 很 有 用 ? 

13. 函数 findBestMove 和 evaluatePosition 中 参数 depth 的 作用 分 别 是 什么 ? 

14. 解释 一 下 evaluateStaticPosition 方 法 在 最 小 最 大 算法 实现 中 的 作用 。 

15. 假设 你 处 在 一 个 位 置 ， 其 中 从 你 的 角度 出 发 ， 关 于 之 后 两 步 棋 的 分 析 展 示 了 下 面 的 评分 结果 : 
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如 果 你 采用 最 小 最 大 策略 ， 那 么 这 种 情况 下 ， 最 好 的 走 法 是 什么 ?从 你 的 角度 看 ， 这 一 步 的 评分 
是 多 少 ? 


习题 


I 


N 


在 许多 迷宫 中 ， 有 多 条 路 径 。 例 如 ， 图 9-7 展示 了 同一 迷宫 的 三 种 解法 。 然 而 ， 三 种 解法 没有 一 种 
是 最 佳 的 。 通 过 迷宫 的 最 短路 径 的 长 度 是 11: 





图 9-7 通过 迷宫 的 多 条 路 径 
编写 一 个 函数 : 


int shortestPathLength (Maze & maze, Point start); 


该 函数 返回 从 指定 地 点 出 发 到 达 出 口 的 最 短路 径 的 长 度 。 如 果 该 迷宫 问题 不 存在 解法 ，shortest 
PathLength 应 该 返回 -1。 


.正如 图 9-3 所 实现 的 ，solveMaze 函数 在 发 现 从 一 点 出 发 没有 解法 时 ， 会 擦 除 每 个 方 格 的 标记 。 尽 


管 这 种 设计 策略 有 一 个 优点 ， 即 迷宫 的 最 终 解法 的 布局 由 一 系列 带 标记 的 点 表示 ， 但 是 对 于 整个 算 
法 的 效率 而 言 ， 回 湖 时 擦 除 标记 的 方 格 会 付出 很 大 的 代价 。 如 果 你 已 经 标记 了 一 个 方 格 并 且 回 湖 经 
过 它 ， 你 就 已 经 搜索 了 从 那个 方 格 出 发 的 所 有 可 能 情况 。 如 果 从 其 他 某 条 路 径 又 回 到 该 点 ， 你 也 要 
借助 前 面 的 分 析 ， 而 不 是 再 进行 一 次 相同 的 探索 。 

就 效率 而 言 ， 为 了 理解 这 些 擦 除 标 记 的 操作 花费 多 大 ， 扩 展 solveMaze 程序 使 它 能 记录 处 理 过 程 
中 递归 调用 的 次 数 。 使 用 该 程序 来 计算 ， 如果 unmarksquare 调用 仍 作 为 程序 的 一 部 分 ， 解 决 下 
面 的 迷宫 问题 需要 多 少 次 递归 : 





A 
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再 次 运行 程序 ， 这 次 不 调用 unmarkSquare 函数 ， 递 归 调 用 的 次 数 有 何 变化 ? 


. 上 一 题 的 结果 清楚 地 表明 : 通过 在 Maze 类 中 使 用 marksquare 机 制 来 记录 迷宫 的 路 径 需要 花费 很 


大 的 代价 。 一 种 更 实际 的 方法 是 改变 递归 函数 的 定义 ， 使 得 它 只 记录 当前 路 径 。 遵 循 solveMaze 
的 逻辑 ， 编 写 一 个 函数 : 


bool findSolutionPath(Maze & maze, Point start, 
Vector«Point» & path); 


该 方法 的 参数 除了 起 始 位 置 之 外 ， 还 有 一 个 Point 值 的 矢量 path 和 solveMaze, findSolution 
Path 一 样 ， 通 过 返回 一 个 布尔 值 来 表示 迷 富 是 否 有 解 。 另 外 ，findSolutionPath 函数 以 一 系 
列 的 坐标 来 初始 化 path 数组 的 元 素 ， 坐 标 从 起 点 位 置 开 始 ， 并 以 迷 富 出 口外 第 一 个 方 格 的 坐标 结 
束 。 对 于 本 题 ，findPath 可 以 寻找 任何 路 径 ， 不 一 定 要 找 最 短 的 那 条 。 


.大 多 数 个 人 计算 机 的 画图 程序 都 可 以 用 纯色 来 填充 一 个 封闭 区 域 。 典 型 地 ， 通 过 选择 “颜色 填充 ” 


工具 ， 然 后 使 用 你 图 形 中 的 光标 点 击 鼠 标 ， 你 可 以 调用 这 个 操作 。 当 你 这 样 做 之 后 ， 颜 色 就 会 布 满 
它 能 到 达 的 图 形 的 每 一 部 分 ， 而 不 是 通过 线 。 
例如 ， 假 设 你 已 经 画 了 下 面 这 样 一 幅 房 屋 图 : 


如 果 你 选择 颜色 填充 工具 并 在 门 内 点 击 ， 画 图 程序 就 会 填充 以 门 为 边界 的 区 域 ， 如 以 下 左 图 所 示 。 
如 果 你 点 在 房屋 前 面 墙 上 某 个 地 方 ， 程 序 就 会 将 窗户 以 及 门 以 外 的 全 部 区 域 填充 ， 如 以 下 有 图 所 示 : 





为 了 理解 这 个 过 程 是 如 何 工 作 的 ， 需 要 理解 计算 机 屏幕 实际 上 是 被 分 解 成 称 之 为 像素 (pixel) 的 点 
阵 。 在 黑白 显示 器 上 ， 像素 点 要 么 是 黑 的 ， 要 么 是 白 的 。 颜 色 填 充 操作 就 是 从 点 击 的 点 开始 涂 黑 连 
通 的 白色 像素 点 。 因 此 ， 前 两 个 图 在 屏幕 上 的 像素 点 如 下 图 所 示 : 
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Hi Grid«bool» 类 型 来 表示 一 个 像素 网 格 是 非常 简单 的 。 网 格 中 白色 的 像素 点 的 值 为 false， 
黑色 的 则 为 tzue。 给 出 这 种 表示 方法 ， 编 写 一 个 函数 : 
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void fillRegion(Grid«bool» & pixels, int row, int col) 


它 通过 从 某 个 具体 的 行 和 列 开 始 在 绕 过 存在 的 黑色 像素 点 的 情况 下 ， 将 能 接触 到 的 白色 像素 点 涂 黑 
来 模拟 颜色 填充 工具 的 操作 。 

5. 在 国际 象棋 中 ， 最 有 威力 的 棋子 就 是 皇后 ， 该 棋子 可 以 在 任意 方向 移动 任意 数目 的 方 格 ， 要 么 水 平 
移动 ， 要 么 垂直 移动 ， 要 么 沿 对 角 线 移动 。 例 如 ， 下 面 的 棋盘 显示 的 皇后 棋 可 以 移动 到 标记 的 任何 
一 个 方 格 : 





即使 皇后 棋 可 以 纵横 很 多 方 格 ， 还 是 可 以 在 8X8 的 棋盘 上 放置 8 个 皇后 使 它们 之 间 不 能 相互 攻击 ， 
如 下 图 所 示 : 





编写 一 个 程序 ， 解 决 更 普遍 的 问题 ， 即 是 否 能 在 NXN 的 棋盘 中 放置 N 个 皇后 ， 使 它们 在 一 步 
之 内 无 法 攻击 对 方 。 你 的 程序 应 该 能 显示 一 种 解决 方案 或 者 报告 无 解 。 
6. 在 国际 象棋 中 ,骑士 走 的 是 “L” 形 路 : 沿 横向 或 纵向 移动 两 个 方 格 ， 再 垂直 移动 一 个 方 格 。 例 如 ， 
下 图 中 白 骑 士 可 以 移动 到 任何 以 X 标记 的 方 格 : 








接近 棋盘 边缘 会 降低 骑士 的 机 动 性 ， 正 如 角落 中 的 黑 骑士 所 示 ， 它 只 能 到 达 两 个 以 o 为 标记 的 
方 格 。 421 
事实 证 明 : 一 个 骑士 在 不 重复 踏 人 相同 方 格 的 前 提 下 ， 可 以 访问 棋盘 上 64 个 方 格 。 骑 士 不 重复 走 过 
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所 有 这 些 方 格 的 路 径 被 称 作 骑士 之 旅 (knight's tour)。 下 图 就 展示 了 这 样 的 一 次 旅行 ， 其 中 ， 方 格 
中 的 数字 表示 它们 被 访问 的 先后 顺序 : 





编写 一 个 程序 ， 要求 使 用 回溯 递归 找到 一 条 骑士 之 旅 。 

7. Æ 20 世纪 60 年代 ,一 种 称 作 四 色 方 柱 ( Instant Insanity) 的 谜 题 曾经 风靡 了 好 多 年 。 这 个 谜 题 包含 
四 个 方块 ， 它 们 分 别 被 涂 上 了 红色 、 蓝 色 、 绿 色 以 及 白色 ， 在 下 面 的 问题 中 ， 分 别 用 它们 的 英文 首 
字母 来 表示 。 谜 题 的 目标 就 是 将 这 些 方块 排 成 一 行 ， 无 论 你 从 任何 一 条 边 看 一 条 直线 ， 你 都 看 不 到 
重复 的 颜色 。 

在 二 维 平面 中 很 难 画 出 方块 ， 但 是 如 果 你 将 它们 展开 并 放 在 平面 上 ， 下 图 展示 了 它们 的 形状 : 


422 编写 一 个 程序 ， 要 求 使 用 回溯 来 解决 四 色 方 柱 谜 题 。 
8. 理论 上 ， 本 章 描述 的 递归 回 漳 策 略 应 该 足以 解决 涉及 一 系列 连续 移动 达到 目标 状态 的 迹 题 。 然 而 ， 
实际 中 许多 这 样 的 谜 题 太 复杂 而 不 能 在 合理 的 时 间 内 完成 。 有 一 种 谜 题 仅仅 会 在 达到 递归 约束 条 件 
时 完成 ， 而 没有 其 他 捷径 可 寻 ， 它 就 是 起 始 于 17 世纪 的 孔 阴 棋 (peg solitaire ) 。 孔 明 棋 通常 会 在 这 


样 一 个 棋盘 上 来 玩 : 


图 中 的 黑 点 表示 棋子 ， 除 了 中 间 的 洞 ， 棋 盘 都 被 黑 点 填 满 了 。 每 一 轮 你 需要 跳 过 一 个 棋子 然后 拿 走 
它 ， 如 下 图 所 示 ， 其 中 ， 黑 棋 跳 到 了 中 间 的 空洞 里 面 ， 并 且 中 间 的 棋子 被 移 走 : 


9. 
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eee 
eee ees 
ecc0000 ecc0000 
e0091000, — 00500000 
ecc0000 ecc0000 
eee eee 
eee eee 


该 游戏 的 目标 是 进行 一 系列 的 跳跃 ， 使 得 只 剩 一 个 棋子 留 在 中 间 的 洞 里 。 编 写 程序 解决 此 迹 题 。 
m M uS RE 其 中 每 一 个 都 由 一 些 点 进行 标记 。 例 如 ， 下 面 四 
个 矩形 块 都 代表 一 个 多 米 诺 骨 


多 米 诺 骨 牌 可 以 通过 首尾 相 接 形成 链 ， 其 前 提 条 件 是 : 只 有 当 两 个 多 米 诺 骨牌 接触 的 地 方 点 数 
匹配 时 才 可 以 连接 。 例 如 ， 你 可 以 形成 一 个 链 ， 这 个 链 包含 四 张 多 米 诺 骨 牌 ， 这 四 张 牌 以 下 面 的 顺 


序 连 接 : 


在 传统 的 游戏 中 ， 多 米 诺 骨牌 可 以 通过 旋转 180 度 来 反 转 数字 。 例 如 ， 在 这 条 链 中 ， 牌 1-6 和 牌 3-4 
都 被 反 转 使 得 它们 适用 这 条 链 。 

假设 你 能 使 用 Domino 类 ( 见 第 6 章 习 题 1 )， 它 提供 了 getLeftDots 和 getRightDots 方 
法 。 利 用 这 个 类 ， 编 写 一 个 递归 函数 : 


bool formsDominoChain(Vector«Domino» & dominos); 


如 果 可 以 将 矢量 中 每 一 个 多 米 诺 骨 牌 连接 成 一 条 链 ， 函 数 返回 trues 


10. 假设 你 被 分 派 了 一 项 工作 ， 要 去 为 一 个 建筑 工程 购买 管道 。 上 司 给 了 你 一 个 清单 ， 上 面 有 需要 的 一 


— 
— 


些 不 同 长 度 的 管子 ， 但 是 零售 店 只 有 一 种 固定 规格 的 管子 。 不 过 ， 你 可 以 根据 需要 切断 管子 。 你 
的 工作 是 计算 出 最 小 数目 的 库存 管 来 满足 清单 的 要 求 ， 这 样 也 能 省 钱 并 使 开销 最 小 。 
编写 一 个 递归 函数 : 


int cutStock (Vector<int> & requests, int stockLength); 


该 函数 有 两 个 参数 (需求 的 矢量 的 长 度 和 零售 店 的 库存 管 长 度 )， 并 返回 满足 需求 矢量 数组 需要 的 
库存 管 的 最 小 数目 。 例 如 ， 如 果 数 组 中 是 [4，3，4，1，7，8]， 并 且 库 存 管 的 长 度 为 10， 那 么 你 
可 以 买 三 个 库存 管 并 将 其 分 割 如 下 : 

管子 1: 4,4,1 

EF 2, 3,7 

41-3. 8 

这 样 做 会 剩余 两 小 节 管 子 。 还 有 其 他 的 分 配方 法 也 使 用 到 三 个 库存 管 ， 但 是 任务 完成 时 ， 剩 余 量 
不 会 更 少 。 


.大 多 数 操作 系统 和 许多 应 用 程序 都 允许 用 户 使 用 文件 支持 通配符 模式 (wildcard pattern), FẸ 


中 特殊 的 字符 被 用 来 创建 文件 名 模式 来 匹配 许多 不 同 的 文件 。 在 通配符 中 最 常见 的 字符 就 是 
“?”, 它 可 以 匹配 任意 单个 字符 ,， 还 有 “*”， 它 用 来 匹配 任意 的 字符 序列 。 一 个 文件 名 模式 中 
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的 其 他 字符 必须 匹配 文件 名 中 相应 的 字符 。 例 如 ， 模 式 “*.*” 可 匹配 任何 形式 的 文件 名 ,例如 
EnglishWords.dat 以 及 HelloWorld.cpp, 但 是 不 能 匹配 不 包含 点 号 的 文件 名 。 类 似 地 ， 模 
X test.? 匹配 任何 包含 名 字 test、 一 个 点 号 以 及 一 个 单一 字符 的 文件 名 。 因 此 ，test .3? 匹配 
test.h 但 不 匹配 test .cpp。 这些 模 式 可 以 用 你 喜欢 的 任何 方式 组 合 。 例 如 ， 模式“??*” 匹 
配 任 何 至 少 包含 两 个 字符 的 文件 名 。 

编写 一 个 函数 : 


bool wildcardMatch(string filename, string pattern); 


该 函数 有 两 个 字符 串 参 数 ， 分 别 表 示 文 件 名 和 通配符 ， 并 且 如 果 文 件 名 和 模式 匹配 时 ， 函 数 返回 
true. Alt, 


wildcardMatch("US.txt", "*.*") 返回 true 
wildcardMatch("test", "*.*") 返回 false 
wildcardMatch("test.h", "test.?") 返回 true 
wildcardMatch("test.cpp", "test.?") 返回 false 
wildcardMatch("x", "??*") 返回 false 
wildcardMatch("yy", "??*") 返回 true 
wildcardMatch("zzz", "??*") 返回 true 


12. 重 写 简单 的 拿 子 游戏 ， 要 求 它 使 用 图 9-6 所 示 的 一 般 化 的 最 小 最 大 算法 。 你 的 程序 不 能 改变 


13. 


findBesrMove 以 及 evaluatePosition 的 实现 代码 。 你 的 工作 就 是 提出 一 个 合适 的 关于 
Move 类 型 和 游戏 具体 实现 方法 的 定义 ， 使 得 程序 仍 可 以 完成 一 个 完美 的 游戏 。 

修改 你 在 习题 12 中 编写 的 拿 子 游戏 的 代码 ， 使 得 程序 可 以 玩 一 个 不 同 的 拿 子 游戏 。 在 这 个 版 本 中 ， 
桌子 上 一 开始 有 17 枚 硬币 。 每 一 轮 玩家 可 以 选择 从 桌子 上 拿 走 一 枚 、 两 枚 、 三 枚 ， 或 者 四 枚 硬 
币 。 在 简单 的 拿 子 游戏 中 ， 玩 家 拿 走 的 硬币 直接 被 忽视 了 ， 在 这 个 游戏 版 本 中 ， 拿 走 的 硬币 积累 
交 给 每 个 玩家 。 在 最 后 一 枚 硬币 被 拿 走 以 后 ， 手 中 有 偶数 个 硬币 的 玩家 赢得 游戏 。 


14. 在 大 多 数 拿 子 游戏 中 ， 硬 币 并 不 是 放 成 一 堆 ， 而 是 如 下 图 所 示 被 排列 成 三 行 : 


15. 


00 
0600 
06000 


游戏 的 每 一 步 包括 拿 走 任意 数目 硬币 ， 前 提 是 所 有 的 硬币 必须 来 自 于 同一 行 。 拿 走 最 后 一 枚 硬币 
的 玩家 为 输 。 

编写 一 个 程序 ， 要 求 使 用 最 小 最 大 算法 来 完成 一 个 完美 的 三 堆 拿 子 游戏 。 这 里 展示 的 开始 布 
局 是 一 个 非常 典型 的 示例 ， 但 是 你 的 程序 应 该 足够 一 般 化 ， 这 样 你 很 容易 改变 行 数 以 及 每 一 行 的 
硬币 数 。 
三 联 棋 (tic-tac-toe) (或 者 naught and cross) 游戏 的 玩法 是 两 个 玩家 轮流 在 如 下 的 3X3 的 网 格 中 放 
置 X 和 o: 
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游戏 目的 是 将 你 自己 的 三 个 符号 放 在 一 行 中 ,垂直 、 水 平 ， 或 者 对 角 线 放置 。 例 如 ， 在 下 面 的 游 
戏 中 ， 顶 部 的 x 因为 三 个 在 同一 行 中 ， 所 以 已 经 赢得 了 游戏 : 


XpXpX 
O 
O| [X 


An HE lof S. AUCH FETA SEI — T, ERRA F, ES KE BUR TER B) RR 
(cat's game). 

编写 一 个 程序 ， 要 求 使 用 最 小 最 大 算法 来 实现 一 个 完美 的 三 联 棋 游 戏 。 图 9-8 展示 了 对 战 一 个 
特别 笨 的 玩家 的 运行 示例 。 





图 9-8 三 联 棋 游 戏 的 运行 示例 
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16. 拼 字 游戏 是 在 一 个 4X4 的 网 状 方块 上 玩 的 ， 每 一 个 网 格 表面 都 有 一 个 字母 。 目 标 是 尽 可 能 多 地 
连接 四 个 或 更 多 的 字母 ， 连 接 仅 限 于 水 平 、 垂 直 ， 或 者 沿 对 角 线 邻接 的 字母 方 体 中 ， 并 且 不 能 
使 用 一 个 方 格 超过 一 次 。 图 9-9 展示 了 拼 字 一 种 可 能 的 布局 以 及 可 以 在 该 布局 中 连接 的 单词 ， 这 
些 单词 都 在 Englishwords .dat 字 典 中 。 举 个 例子 ， 你 可 以 利用 下 面 的 方块 序列 来 组 成 单词 


"programming " : 





编写 一 个 函数 : 


void findBoggleWords (const Grid<char> & board, 


const Lexicon & english, 
Vector<string> & wordsFound); 


它 的 功能 是 找到 棋盘 中 在 英语 大 字典 中 出 现 的 所 有 合法 单词 ， 并 且 将 这 些 单 词 添加 到 矢量 


wordsFound 中 。 


ager 
ammino 
cion 
gamming 
glamor 
gomeral 
gramp 
largo 
meal 
nice 
normal 
plage 
prong 
realm 
roger 





图 9-9 拼 字 游戏 的 示例 配置 及 它 所 包含 的 单词 
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Programming Abstractions in C++ 


算法 分 析 


没有 分 析 ， 就 没有 综合 。 
一 一 弗 里 德里 希 . 站 ,恩格斯 ,《 反 杜 林 论 》 1878 


在 第 7 章 ， 你 学 习 了 函数 fib (n) 的 两 种 不 同 的 递归 实现 ， 这 个 函数 用 来 计算 斐 波 那 
契 数 列 中 的 第 n 项 。 第 一 种 递归 实现 直接 以 下 面 的 数学 定义 为 基础 : 


n n=0, 1 
fib(n) = 


fib(n-1) + fib(n-2) 其 他 


它 非常 低 效 。 第 二 种 实现 使 用 了 可 加 序列 的 概念 ， 从 而 产生 了 一 个 新 的 fib (n) 函数 版 本 ， 
它 与 传统 的 迭代 方法 相 比 更 高 效 ， 这 说 明 递归 本 身 并 不 是 产生 问题 的 原因 。 即 使 如 此 ， 由 于 
第 一 个 版 本 的 斐 波 那 契 数 列 函 数 需要 如 此 高 的 执行 代价 ， 以 致 递归 常常 获得 了 一 个 坏 名 声 。 

正如 本 章 将 要 阐述 的 ， 递 归 地 思考 一 个 问题 的 能 力 经 常会 产生 出 新 的 策略 ， 这 些 新 策略 
远 比 那些 由 一 个 迭代 设计 过 程 产生 的 任何 策略 都 要 高 效 。 分 治 算法 的 强大 功能 对 很 多 实际 问 
题 都 有 着 意义 深远 的 影响 。 通 过 使 用 这 种 形式 的 递归 算法 ， 其 求解 效率 得 到 了 显著 的 提升 ， 
其 提升 的 效率 不 是 2 一 3 个 数量 级 ， 而 是 成 千 甚 至 更 高 的 数量 级 。 

然而 ， 在 你 了 解 这 些 算 法 之 前 ， 询 问 几 个 问题 非常 重要 。 对 一 个 算法 而 言 ， 术 语 效率 意 
味 着 什么 ? 如何 评 估 一 个 算法 的 效率 ”这 些 问题 形成 计算 机 科学 的 一 个 子 领 域 ， 即 算法 分 析 
(analysis of algorithm)。 尽 管 对 算法 分 析 的 详细 理解 需要 一 个 合理 的 数学 工具 以 及 大 量 的 思 
考 , 但 是 你 可 以 通过 研究 几 个 简单 算法 的 性 能 对 算法 分 析 有 一 个 感性 认识 。 


10.1 排序 问题 


领会 算法 分 析 重 要 性 的 最 好 方法 就 是 考虑 一 个 问题 域 ， 其 中 不 同 算法 的 性 能 有 很 大 的 差 
别 。 当 然 ， 这 些 问 题 域 中 一 个 最 有 趣 的 问题 就 是 排序 (sorting) 问题 ， 排 序 就 是 将 一 个 数组 
或 者 一 个 矢量 中 的 元 素 重 新 进行 排列 ， 以 使 它们 以 一 个 既定 的 顺序 排列 。 例 如 ， 假 设 你 能 对 
存储 在 Vector<int> 类 的 变量 vec 中 的 以 下 元 素 进 行 排序 : 


sss [s [s [ww [v [w. 
0 1 2 3 4 5 6 7 
你 的 任务 就 是 编写 一 个 函数 sort (vec) ， 它 能 以 升序 方式 重新 排列 这 些 元 素 ， 如 下 图 
所 示 : 
IJCICIEJEOEIESES 


10.1.1 选择 排序 算法 
有 很 多 可 供 选 择 的 算法 可 使 你 以 升序 方式 重新 排列 一 个 矢量 中 的 整 型 元 素 。 其 中 最 简单 
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的 一 种 算法 称 为 选择 排序 (selecting sort) 算法 。 给 定 一 个 大 小 为 YX 的 矢量 ， 选 择 排 序 算 法 
会 仔细 检查 其 中 每 个 元 素 的 位 置 并 找到 该 元 素 值 在 最 终 排 好 序 的 矢量 中 应 占据 的 位 置 。 如 果 
算法 发 现 了 一 个 合适 的 元 素 ， 它 就 将 该 元 素 与 先前 占据 这 个 位 置 的 元 素 进行 交换 以 确保 没有 
丢失 元 素 。 因 此 ， 在 第 一 次 循环 中 ， 算 法 找 出 最 小 的 元 素 并 将 其 与 C++ 中 出 现在 索引 位 置 
0 处 的 第 一 个 元 素 进行 交换 。 在 第 二 次 循环 中 ， 算 法 找 出 次 小 元 素 并 将 其 与 数组 中 的 第 二 个 
元 素 进 行 交换 。 之 后 ， 算 法 以 此 策略 继续 执行 ， 直 到 矢量 中 所 有 位 置 上 的 元 素 都 正确 排序 为 
止 。 图 10-1 展示 了 一 种 使 用 选择 排序 的 sort 实现 。 


/* 


* Implementation notes: sort 
* 


* This implementation uses an algorithm called selection sort, which can 
* be described as follows. With your left hand (1h), point at each element 
* in the vector in turn, starting at index 0. At each step in the cycle: 


- Find the smallest element in the range between your left hand and the 
end of the vector, and point at that element with your right hand (rh). 


. Move that element into its correct position by exchanging the elements 
indicated by your left and right hands. 


void sort (Vector<int> & vec) ( 

int n - vec.size(); 

for (int lh = 0; lh < n; lh++) ( 
int rh - lh; 
for (int i = lh + 1; i < n; itt) { 

if (vec[i] < vec[rh]) rh = i; 

) 
int tmp = vec[lh]; 
vec[lh] = vec[rh]; 


vec[rh] = tmp; 





图 10-1 选择 排序 算法 的 实现 
例如 ， 如 果 矢 量 中 的 初始 内 容 如 下 : 


TE 
0 l 2 3 4 5 6 7 


在 外 层 for 循环 的 第 一 次 循环 中 ， 算 法 会 将 位 于 索引 位 置 5 的 元 素 19 标识 为 整个 矢量 
中 最 小 的 元 素 ， 然 后 将 其 与 位 于 索引 位 置 0 的 56 进行 交换 ， 排 序 结果 如 下 : 


四 加 回回 四 加 加 加 
0 1 2 3 + 5 6 7 


在 第 二 次 循环 中 ， 算 法 在 索引 位 置 1 与 7 之 间 寻 找 最 小 元 素 ， 其 结果 为 位 于 位 置 1 的 
25。 程 序 向 前 执行 并 且 不 进行 元 素 的 交换 操作 。 在 其 后 的 每 次 循环 中 ， 算 法 执行 一 个 交换 操 
作 从 而 将 下 一 个 最 小 的 元 素 移 到 合适 的 最 终 位 置 。 当 for 循环 结束 时 ， 整 个 矢量 中 的 元 素 
就 已 经 排序 完毕 。 


10.1.2 ”性 能 的 经 验 评 估 


作为 一 种 排序 策略 ， 选 择 排序 算法 的 效率 如 何 ? 为 了 回答 这 个 问题 ， 收 集 不 同 规模 的 元 
素 排序 所 耗费 的 计算 时 间 的 实际 数据 对 我 们 会 很 有 帮助 。 例 如 ， 当 在 我 的 MacBook Pro 笔 
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记 本 上 运行 排序 算法 时 ， 我 观测 到 以 下 的 运行 时 间 ， 这 里 N 代表 矢量 中 的 元 素 个 数 : 
N 运行 时 间 


| 10 | 0.0000024s 
|50 | 0.0000448s 






|100 | 0.000169s 
| 500 | 0.00402s 
| 5000 | 0395s 

10 000 


50000 | 396s | 
100 000 158.7 s 


对 于 一 个 包含 10 个 整数 的 矢量 而 言 ， 选 择 排序 算法 只 用 几 微 秒 的 时 间 就 完成 了 工作 。 即 
使 对 于 5000 个 整数 来 说 ， 函 数 sort 的 这 个 实现 也 只 花费 了 不 超过 一 秒 的 时 间 ， 就 我 们 
人 类 对 时 间 的 感 党 来 说 ， 这 段 时 间 无 疑 是 非常 短 的 。 然 而 ， 随 着 矢量 规模 的 不 断 增 大 ， 选 
择 排序 算法 的 性 能 开始 逐渐 衰退 。 对 于 一 个 含有 100 000 个 整数 的 矢量 而 言 ， 该 算法 需要 超 
过 两 分 半 的 时 间 才 能 完成 。 如 果 你 坐 在 你 的 计算 机 前 等 待 结果 ， 那 么 这 个 时 间 就 显得 非常 
长 了 。 

更 令 人 不 安 的 是 ， 选 择 排序 算法 的 性 能 随 着 矢量 规模 的 增 大 而 迅速 地 恶化 。 正 如 你 可 
以 从 以 上 计时 数据 中 看 到 的 一 样 ， 每 次 你 将 需要 排序 的 值 的 数量 扩大 10 倍 ， 则 其 排序 所 需 
的 时 间 将 增长 百倍 。 因 此 ， 对 一 个 包含 有 百 万 个 数字 的 序列 进行 排序 将 会 花费 大 约 四 个 半 小 
时 。 如 果 你 在 工作 中 需要 处 理 这 种 规模 的 数据 ， 那 你 只 能 去 寻找 一 种 更 为 有 效 的 方法 。 


10.1.3 ”分 析 选 择 排序 算法 的 性 能 


随 着 所 需 排序 数据 规模 的 增 大 ， 为 什么 选择 排序 算法 的 性 能 会 变 得 如 此 之 差 呢 ? 为 了 回 
答 这 个 问题 ， 我 们 需要 思考 算法 在 每 一 个 外 层 循环 中 都 做 了 些 什么 。 为 了 正确 地 确定 矢量 中 
的 第 一 个 最 小 值 ， 选 择 排序 算法 必须 考虑 在 YX 个 元 素 中 进行 查找 。 因 此 ， 第 一 次 循环 所 需 
的 时 间 大 概 是 与 N 成 正比 的 。 对 于 矢量 中 的 其 他 元 素 ， 算 法 执行 相同 的 基本 操作 ， 但 是 每 
次 都 考虑 更 少 的 元 素 。 第 二 次 循环 考虑 N-1 个 元 素 ， 第 三 次 循环 考虑 N-2 个 元 素 ， 依 此 类 
推 。 因 此 ， 总 的 运行 时 间 大 约 正比 于 以 下 式 子 : 
NI 


由 于 很 难处 理 这 样 一 个 展开 形式 的 表达 式 ， 所 以 通过 运用 一 点 数学 知识 来 简化 这 个 表达 
式 是 很 有 用 的 。 你 可 能 已 经 在 代数 课 上 学 过 前 个 整数 的 求 和 公式 为 : 
Nx(N+1) 
2 





或 者 ， 将 其 分 子 相 乘 并 展开 后 为 : 
N.N 
2 
你 将 会 在 10.6 节 中 学 到 如 何 证 明 这 个 公式 的 正确 性 。 目 前 ， 你 所 要 知道 的 就 是 前 N 个 整数 
之 和 可 以 使 用 这 种 更 加 简洁 的 形式 来 表达 。 


如 果 写 出 以 下 函数 的 值 : 
N.N 
2 


294 &10*€ 


对 于 N 的 不 同 取 值 ， 如 果 你 根据 以 上 公式 计算 对 应 的 值 ， 你 会 得 到 如 下 所 示 的 表格 : 
N2+N 


N 2 
ae = 1275 
BEN | 125 250 
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由 于 选择 排序 算法 的 运行 时 间 可 能 与 算法 所 需要 做 的 工作 总 量 有 关 ， 因 此 ， 表 格 中 的 数值 应 
该 大 致 与 算法 运行 时 间 的 观测 值 成 比例 ， 它 也 得 到 了 证 实 。 例 如 ， 如 果 你 观察 图 10-2 中 选 
择 排序 所 测 得 的 计时 数据 ， 你 会 发 现 该 算法 需要 1.58 s 来 处 理 10 000 个 数据 。 在 这 段 时 间 
内 ， 选 择 排序 算法 内 部 执行 了 50 005 000 次 操作 。 假 设 在 这 两 个 值 之 间 确 实 存在 一 个 比例 关 
系 ， 用 执行 时 间 除 以 总 的 操作 次 数 得 到 下 面 这 个 近似 的 比例 常数 : 
1.58 s 

50 005 000 
如 果 你 对 于 表 中 的 其 他 记录 应 用 相同 的 比例 常数 ， 至 少 在 YX 取 较 大 值 的 时 候 ， 那 么 你 会 发 
现 以 下 公式 : 





= 3.16x10*s 


2 
3.16 «10-8 AM 


提供 了 运行 时 间 的 一 个 合理 的 近似 值 。 图 10-2 中 表示 的 是 观测 的 时 间 和 使 用 这 个 公式 计算 
的 估计 时 间 ， 以 及 两 者 之 间 的 相对 误差 。 


N 观测 时 间 估计 时 间 





图 10-2 选择 排序 算法 的 观测 时 间 与 估计 时 间 


10.2 时间 复杂 度 


像 图 10-2 所 示 的 那样 详细 地 分 析 算 法 所 存在 的 问题 是 : 你 最 终 总 是 得 到 过 多 的 信息 。 尽 
管 有 一 个 公式 能 够 准确 地 预测 一 个 程序 执行 将 要 花费 多 长 时 间 有 时 是 有 用 的 ， 但 同时 得 到 的 
大 量 定 性 指标 也 会 让 你 偏离 主题 。 当 N 较 大 时 ， 选 择 排序 算法 不 可 行 的 原因 在 于 : 它 与 运行 在 
笔记 本 电脑 上 的 一 个 特定 算法 实现 的 精确 计时 特性 没有 太 多 关系 。 这 个 问题 现在 变 得 更 简单 并 
且 更 基础 了 。 从 本 质 上 讲 ， 选 择 排序 算法 的 问题 是 : 如果 待 排序 的 元 素数 目 翻 倍 ， 则 选择 排序 
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算法 的 运行 时 间 将 增 大 四 倍 ， 这 意味 着 其 运行 时 间 的 增长 要 比 待 排序 元 素数 目的 增长 快 得 多 。 

关于 算法 效率 你 所 能 获得 的 最 有 价值 的 定性 观察 ， 通 常 有 助 于 你 理解 因 问题 规 模 变 化 而 
引发 的 算法 性 能 变化 。 问 题 规模 通常 很 容易 量化 。 例 如 ， 如 果 算 法 操作 的 是 数字 ， 则 通常 用 
数字 本 身 的 规模 作为 问题 规模 。 就 大 多 数 对 数组 或 者 矢量 进行 操作 的 算法 而 言 ， 你 可 以 使 用 
数组 中 的 元 素 个 数 表示 问题 的 规模 。 当 计算 算法 的 效率 时 ， 计 算 机 科学 家 无 论 如 何 进 行 计算 
都 习惯 上 使 用 字母 YX 来 表明 问题 的 规模 。 随 着 NN 的 变 大 ，N 与 一 个 算法 性 能 之 间 的 关系 称 
为 该 算法 的 时 间 复 杂 度 (computational complexity)。 通 常 ， 尽 管 也 可 能 对 其 他 因素 进行 所 需 
的 内 存 空间 总 量 进行 评估 ,但 是 对 算法 性 能 最 重要 的 度量 是 其 执行 时 间 。 除 非特 殊 声明 ， 否 
则 本 书 中 所 有 的 算法 复杂 度 均 指 的 是 其 执行 时 间 。 
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计算 机 科学 家 采用 一 种 特殊 的 助 记 符 来 表示 算法 的 时 间 复 杂 度 ， 这 个 符号 称 为 大 O 符 
号 (big-O notation)。 大 O 符号 由 德国 数学 家 保罗 “' 巴赫 曼 在 1892 年 引入 一 一 这 远 在 计算 
机 出 现 之 前 。 这 个 符号 本 身 非常 简单 ， 由 字母 0 后 跟 一 对 圆 括号 括 起 来 的 公式 组 成 。 采 用 
此 符号 表示 算法 复杂 度 时 ， 其 中 的 公式 通常 是 一 个 涉及 问题 规模 N 的 简单 函数 。 例 如 ， 本 
章 中 你 很 快 会 遇 到 大 O 表示 法 : 
O (N?) 


可 读 作 “NN 平方 的 大 0”。 

大 O 符号 常用 于 表明 算法 的 定性 近似 值 ， 因 此 ， 它 是 一 个 算法 时 间 复 杂 度 的 理想 表示 。 
由 于 该 表示 法 从 数学 中 引入 ， 因 此 ,大 0 符号 有 一 个 精确 的 定义 ， 该 定义 参见 10.2.6 节 。 
然而 ， 此 时 ， 无 论 你 自 认 为 是 程序 员 还 是 计算 机 科学 家 ， 直 观 地 理解 大 O 的 含义 对 你 来 说 
是 至 关 重 要 的 。 


10.2.2 X O 的 标准 简化 


当 你 使 用 大 O 符号 来 估计 一 个 算法 的 时 间 复 杂 度 时 ， 其 目的 就 是 提供 一 个 定性 的 认识 : 
当 N 变 大 时 ， 的 变化 是 如 何 影响 算法 的 性 能 的 。 因 为 大 O 符号 不 是 用 来 定量 度量 的 ， 所 
以 它 不 仅 适 合 而 且 有 助 于 减少 括号 内 的 公式 ， 以 便 能 用 最 简洁 的 形式 来 捕获 一 个 算法 的 行 
为 。 当 使 用 大 O 符号 时 ， 可 使 用 的 最 常用 的 简化 如 下 : 

1. 随 着 W 变 大 ， 删 除 那些 对 总 的 结果 影响 不 大 的 项 。 当 一 个 公式 包含 几 个 相 加 在 一 起 
的 项 时 ， 随 着 N 的 变 大 ， 其 中 一 项 总 比 其 他 项 增加 得 快 ， 即 这 一 项 是 支配 表达 式 结果 的 项 。 
X N 的 值 较 大 时 ， 由 于 这 个 起 支配 作用 的 单独 项 控制 着 算法 的 运行 时 间 ， 因 此 ， 可 以 完全 
忽略 这 个 公式 中 的 其 他 项 。 

2. 删除 任何 常量 因子 。 当 你 计算 算法 复杂 度 时 ， 主 要 关注 点 是 算法 的 运行 时 间 是 如 何 作 
为 问题 规模 的 函数 而 变化 的 。 常 量 因子 总 体 上 对 算法 时 间 性 能 不 会 产生 任何 影响 。 如 果 
你 购买 了 一 台 比 你 原来 的 计算 机 快 2 倍 的 计算 机 ， 对 于 每 一 个 YX 值 ， 在 你 的 机 器 上 执行 的 
任何 算法 将 会 比 在 原来 机 器 上 执行 时 快 2 倍 。 无 论 如 何 ， 这 个 增长 的 模式 将 保持 完全 相同 。 
因此 ， 当 你 使 用 大 O 符号 时 ， 可 以 省 略 掉 常 量 因子 。 


10.2.3 选择 排序 算法 的 时 间 复 杂 度 
可 以 采用 上 节 所 述 的 规则 来 推导 选择 排序 算法 时 间 复 杂 度 的 大 O 表达 式 。 从 10.1.3 节 
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中 的 分 析 ， 你 已 知道 对 入 个 元 素 的 选择 排序 算法 的 运行 时 间 与 以 下 公式 成 比例 : 


N.N 
7] 


尽管 在 大 O 表达 式 中 直接 使 用 这 个 公式 从 数学 上 来 说 是 正确 的 ， 如 下 所 示 : 


oU) M 


但 在 实际 中 ， 你 完全 不 能 这 么 做 ， 因 为 括号 里 的 公式 没有 采用 最 简单 的 形式 。 
简化 这 个 表达 式 的 第 一 步 是 识别 出 这 个 公式 实际 上 为 两 项 之 和 ， 如 下 所 示 : 





N? N 
yo * = 
然后 ， 你 需要 考虑 随 着 N 的 增 大 ， 其 中 的 每 一 项 对 总 公式 的 贡献 ， 其 贡献 如 下 表 所 示 : 
Ne N N74N 
N 2 2 2 
| RUNE X3 












| 10 |  Á 3500] 50| 5050 | 
| 1000 |  — 500000 | $500 | 500500 | 
随 着 N 的 增加 ， 含 有 NC 的 项 迅速 占 主导 地 位 。 因 此 ， 根 据 简 化 规则 ， 可 删除 较 小 的 项 。 即 
使 这 样 ， 也 不 能 把 选择 排序 算法 的 时 间 复 杂 度 写成 以 下 形式 : 


2 
(X) M 
由 于 可 以 删除 常量 因子 ， 因 此 ， 可 以 把 选择 排序 的 算法 复杂 度 用 如 下 最 简单 的 表达 式 表 示 : 


O(N?) 


这 个 表达 式 抓 住 了 选择 排序 算法 性 能 的 本 质 。 随 着 问题 规模 的 增 大 ,算法 的 运行 时 间 趋 向 于 
问题 规模 N 的 平方 倍 。 因 此 ， 如 果 你 将 矢量 中 待 排序 元 素 的 数目 N 扩 大 2 倍 ， 那 么 算法 的 
运行 时 间 将 增 大 4 fis MR 入 增 大 了 10 倍 ， 那 么 算法 的 运行 时 间 将 激增 100 倍 。 


10.2.4 从 代码 中 降低 时 间 复 杂 度 


常常 需要 在 粗略 地 浏览 一 遍 代码 后 就 能 计算 出 其 时 间 复 杂 度 ， 以 下 函数 计算 一 个 矢量 中 
的 元 素平 均值 : 


double average (Vector<double> & vec) ( 
int n = vec.size(); 
double total - 0; 
for (int i= 0; i < n; itt) { 
total += vec[i]; 
} 
return total / n; 


} 


当 调用 这 个 函数 时 ， 这 段 代 码 中 的 部 分 代码 只 执行 了 一 次 ， 例 如 将 total 变量 初始 化 为 0 
以 及 return 语句 中 的 除法 操作 。 这 些 操作 都 消耗 一 个 确定 的 时 间 ， 且 这 些 时 间 严 格 来 说 
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是 常量 ， 它 们 不 会 随 着 矢量 大 小 的 改变 而 改变 。 可 以 认为 那些 执行 时 间 不 依赖 于 问题 规模 的 
代码 在 常量 时 间 (constant time) 内 运行 ,用 0 (1) Xm. 

O (1) 看 起 来 可 能 令 一 些 人 困惑 ， 因 为 括号 里 面 的 表达 式 不 依赖 于 N。 事实 上 ,对 NN 不 
产生 任何 依赖 正 是 O (1) 符号 的 全 部 要 点 。 当 问题 规模 增 大 时 ， 那 些 运 行 时 间 为 O (1) 的 代 
码 所 需 的 执行 时 间 正 与 1 增加 的 方式 完全 相同 ; 换 句 话 说， 也 就 是 代码 的 运行 时 间 不 变 。 

然而 , average 函数 的 其 他 部 分 执行 了 n 次 ， 对 每 一 个 for 循环 ， 它 们 都 执行 了 一 次 。 
包括 在 for 循环 中 的 表达 式 i++ 以 及 语句 


total += vec[i]; 


构成 了 循环 体 。 尽 管 这 部 分 计算 的 任何 一 次 执行 都 耗费 了 一 个 固定 的 时 间 ， 但 事实 上 ， 这 些 
语句 执行 了 n 次 意味 着 它们 总 的 执行 时 间 直 接 与 矢量 的 大 小 成 正比 。avezage 函数 中 这 部 
分 的 算法 复杂 度 是 O(N)， 它 经 常 称 为 线性 时 间 (linear time). 

A, K% average 总 的 运行 时 间 就 等 于 算法 的 常量 部 分 与 线性 部 分 所 需 的 时 间 之 
和 。 然 而 ， 随 着 问题 规模 的 增 大 ， 常 量 项 变 得 越 来 越 不 重要 了 。 通 过 采用 简化 规则 允许 你 
忽略 那些 随 着 的 增 大 而 变 得 不 重要 的 项 ， 故 可 估算 出 average 函数 的 总 体 运行 时 间 为 
O(N). 

尽管 可 以 通过 观察 循环 结构 的 代码 来 预测 算法 的 复杂 度 ， 但 大 多 数 情 况 下 ， 单 个 表达 式 
和 语句 (除非 涉及 必须 单独 计数 的 函数 调用 ) 的 运行 时 间 为 常数 。 就 算法 复杂 度 来 说 ， 最 重 
要 的 就 是 这 些 语句 执行 了 多 少 次 。 对 于 大 多 数 程序 而 言 ， 可 以 通过 找 出 最 经 常 执行 的 代码 来 
确定 算法 的 复杂 度 ， 并 且 将 它 的 运行 时 间 确 定 为 一 个 关于 的 函数 。 在 average MBX 
例子 中 ， 函 数 体 共 执行 了 n 次 。 由 于 没有 其 他 部 分 的 代码 执行 超过 n 次 ， 因 此 可 以 预测 这 
个 函数 的 算法 复杂 度 为 O(N)。 

选择 排序 函数 也 可 以 用 相似 的 方法 进行 分 析 。 这 个 函数 中 最 经 常 执行 的 代码 就 是 比较 
语句 : 


if (vec[i] < vec[rh]) rh = i; 


is iE ERT for 循环 中 ， 其 执行 次 数 取 决 于 六 的 值 。 每 运行 一 次 外 部 循环 ， 内 部 循 
环 就 运行 Y 次 。 这 也 意味 着 内 部 循环 体 执行 了 O (NT) 次 。 和 选择 排序 一 样 ， 具 有 O (N?) 
性 能 的 算法 称 为 以 平方 时 间 (quadratic time) 运行 。 


10.2.5 ”最 坏 情况 以 及 平均 情况 下 的 复杂 度 


某 些 情况 下 ， 一 个 算法 的 运行 时 间 不 仅 取决 于 问题 的 规模 ， 还 取决 于 数据 的 具体 特点 。 
例如 ,考虑 以 下 函数 : 


int linearSearch(int key, Vector<int> & vec) { 
int n = vec.size(): 
for (int i = 0; i < n; it) 1 
if (key == vec[i]) return i; 
} 
return -1; 


} 


它 将 返回 vec 中 key 第 一 次 出 现 的 索引 位 置 ， 或 者 当 key 没有 出 现时 ， 则 返回 -1. AF 
该 实现 中 for 循环 执行 了 n 次， 因此 ， 顾 名 思 义 ， 可 以 预测 函数 1inearsearch 的 性 能 


298 # 10 F 


Æ O(N). 

另 一 方面 ， 对 于 linearSearch 函数 的 某 些 调用 会 很 快 地 执行 。 例 如 ， 假 设 你 正在 寻 
找 的 key 元 素 恰 好 出 现在 这 个 矢量 中 的 第 一 个 位 置 。 此 时 ，for 循环 体内 仅 执行 了 一 次 。 
如 果 你 非常 幸运 ， 总 能 在 矢量 的 开始 位 置 找到 所 需要 的 key fi, 那么 1inearSearch 函数 
将 以 常数 时 间 运 行 。 

当 你 分 析 一 个 程序 的 算法 复杂 度 时 ， 总 是 对 最 小 的 可 能 时 间 不 感 兴趣 。 一 般 情况 下 ， 计 
算 机 科学 家 往往 关心 的 是 以 下 两 类 复杂 度 分 析 : 

e 最 坏 情 况 下 的 复杂 度 。 复 杂 度 分 析 的 最 常见 类 型 由 确定 一 个 算法 在 最 坏 的 可 能 情况 

下 的 性 能 。 这 种 分 析 是 很 有 用 的 ， 因 为 它 允 许 你 给 算法 复杂 度 设立 一 个 上 界 。 如 果 
你 分 析 最 坏 的 情况 ， 你 可 以 确保 算法 的 性 能 将 至 少 比 你 分 析 表 明 的 性 能 要 好 。 你 有 
时 候 可 能 会 很 幸运 ,但 是 当 算法 性 能 降低 时 ， 你 可 能 就 不 那么 自信 了 。 

e 平均 情况 下 的 复杂 度 。 从 实际 观点 来 看 ， 如 果 你 算出 一 个 算法 在 其 所 有 可 能 的 输入 
数据 集 上 行为 的 平均 值 ， 那 么 考虑 这 个 算法 执行 的 好 坏 是 有 用 的 。 特 别 是 当 你 的 具 
体 输入 并 不 是 一 个 典型 的 数据 集 时 ， 平均 情况 分 析 对 于 实际 的 执行 提供 了 最 好 的 统 
计 估 计 。 然 而 ， 问 题 在 于 ,平均 分 析 经 常 是 难以 实施 的 ， 且 需要 相当 复杂 的 数学 分 
析 过 程 。 

对 linearSearch 函数 而 言 ， 最 坏 的 情况 发 生 在 矢量 中 没有 key 时 。 当 key 不 在 其 中 
时 ， 函 数 必 须 完 成 n 次 for 循环， 这 也 就 意味 着 它 的 性 能 是 O (W)。 如 果 该 key CME 
矢量 中 , 那么 for 循环 的 平均 执行 时 间 是 总 时 间 的 一 半 ， 这 也 就 意味 着 其 平均 性 能 也 是 
O (V)。 正 如 你 将 会 在 10.5 节 中 所 观察 到 的 一 样 ， 一 个 算法 的 平均 情况 和 最 坏 情况 的 性 能 经 
常 在 定性 方式 上 有 所 不 同 ， 这 也 就 意味 着 : 在 实际 中 ， 同 时 考虑 这 两 种 性 能 的 特征 是 很 重 
要 的 。 


10.26 大 O 符号 的 正式 定义 


对 于 现代 计算 机 科学 来 说 ， 理 解 大 O 符号 是 非常 重要 的 ， 因此， 提供 一 个 更 加 正式 的 
定义 来 帮助 你 理解 为 什么 大 O 的 直观 模型 可 以 奏效 ， 以 及 为 什么 对 大 O 公式 的 简化 在 实际 
中 是 可 调整 的 ， 将 是 非常 重要 的 。 然 而 ， 做 这 些 不 可 避免 地 需要 一 些 数学 运算 。 如 果 你 很 害 
怕 数 学 ， 请 不 要 担心 。 理 解 大 O 的 实际 意义 远 比 遵循 本 节 所 呈现 的 所 有 步骤 要 重要 。 

在 计算 机 科学 中 ， 大 0 符号 用 于 表达 两 个 函数 之 间 的 关系 ， 通 常 以 下 面 的 表达 式 表示 : 

t(N) = O(f (N)) 
这 个 表达 式 的 正式 含义 是 (N) 是 + (ON). 的 一 个 近似 值 ， 并 且 具 有 以 下 特征 : 一 定 能 够 找 出 
一 个 常量 No 以 及 一 个 正 的 常数 C， 使 得 对 于 每 一 个 大 于 No 的 值 ， 以 下 条 件 均 成 立 : 

(N) & C x f(N) 
换 句 话说 ， 只 要 NN EEK, Me (NV) 的 范围 总 是 在 一 个 常量 与 函数 FON). 相 乘 得 到 的 结果 
范围 内 。 

当 大 O 符号 用 来 表示 计算 复杂 度 时 ， 函 数 1 (N) 代表 算法 的 实际 运行 时 间 ， 通 常 它 难 
Vit. BRA FON) 是 一 个 更 加 简单 的 公式 ， 但 随 着 函数 W 值 的 变化 ， 它 提供 运行 时 间 是 如 
何 变化 的 一 个 合理 的 量化 估 值 ， 由 于 大 O 的 数学 定义 所 表达 的 条 件 ， 它 确保 了 实际 的 运行 
时 间 不 能 够 增长 得 比 f(N) tko 
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为 了 查看 正式 定义 的 应 用 ， 返 回去 重新 查看 选择 排序 是 很 有 用 的 。 分 析 选 择 排 序 的 结构 
表明 了 最 内 层 的 循环 操作 执行 的 次 数 为 : 
N2+N 
a) 


并 且 运 行 时 间 大 概 是 和 这 个 公式 成 正比 的 。 当 这 个 复杂 度 以 大 O 符号 形式 表达 时 ， 常 量 项 
和 低 阶 项 都 被 省 略 了 ， 只 留 下 执行 时 间 为 O(N?) 的 断言 ， 事 实 上 这 个 断言 是 : 

N.N _ 

x = O(N’) 
为 了 证 明 这 个 表达 式 在 大 O 符号 正式 定义 下 确实 是 正确 的 ， 你 所 要 做 的 就 是 求 出 常量 C 和 


No 的 值 ， 使 得 N 宇 No 时， 满足 以 下 条 件 : 


MAN <Cx WN 





这 个 特殊 的 例子 很 简单 ， 因 为 当 设 定常 量 CAN 均 为 1 时 ， 不 等 式 总 是 成 立 的 。 毕 竟 ， 只 
要 NN 不 小 于 1， 就 可 以 得 到 和 NW?* 宇 N。 因 此 ， 这 一 定 会 得 到 以 下 情况 : 

N?+N N? + N? 

fe E ee 


由 于 不 等 式 右边 的 值 仅仅 是 W*， 这 也 就 意味 着 : 
N.N 
E <N? 
XT BUB BS N21 来 说 都 成 立 ， 并 且 NZ14&XE X BPEGKIM. 
可 以 使 用 一 个 类 似 的 参数 来 表示 任何 次 多 项 式 ， 这 个 多 项 式 通常 可 以 表达 成 : 
a N + api NE! + apa N +--+ + aN? + aN + a 
它 为 O(N*)。 和 上 次 一 样 ， 你 的 目标 是 求 出 常量 C 以 及 Ne， 使 得 在 所 有 的 No 三 NN 时， 都 满 
足以 下 条 件 : 
a, N* 十 ay; N*! T eg NP? "t xoxew OF a; N? +a,N + ap «c x N* 
和 以 前 的 例子 一 样 ， 可 以 首先 将 常量 No 的 值 选 择 为 1。 对 于 所 有 的 NS1, NN 的 每 一 个 
连续 的 寡 总 比 它 的 前 驱 的 宕 要 大 ， 因 此 ， 满 足 : 


N'zmNEmENUI...2NEÉI 
这 个 性 质 反 过 来 意味 着 : 
a,N* + api N* + apa N? ta N + ag 
« [a4 N* + layal N* [aka] N* +-+- + [a N* + [ao| N* 


其 中 ， 不等式 右边 用 竖 线 括 起 来 的 系数 为 其 绝对 值 。 通 过 提取 公 因子 N*， 可 以 将 上 述 不 等 
式 的 右边 化 简 为 : 
Cael + paxil + laxa] +--+ + Jail + aol) N* 
因此 ， 如 果 将 常量 C 定义 为 : 
Jag| + [ag] + lak2] +--+ + Jail + |aol 442 
那么 ， 
ay Nt + api NE! + ayy Nh? ----caN + a,N + ag < Cx N 
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这 个 结果 证 明了 完整 的 多 项 式 是 O (N*). 


10.3 递归 的 终止 


此 时 ， 和 刚 开 始 学 习 本 章 的 时 候 相 比 ， 你 已 经 相当 了 解 复 杂 性 分 析 了 。 然 而 ， 对 于 一 个 
大 的 矢量 而 言 ， 在 如 何 编写 一 个 更 加 高 效 的 排序 算法 这 一 问题 上 ， 你 并 非 更 进一步 。 选 择 排 
序 算 法 很 明显 不 适合 这 个 任务 ， 因 为 它 的 运行 时 间 的 增加 是 和 问题 规模 的 平方 成 正比 的 。 对 
于 大 多 数 以 线性 顺序 处 理 矢 量 中 元 素 的 排序 算法 来 说 ， 这 都 是 相同 的 。 为 了 开发 出 一 个 更 好 
的 排序 算法 ， 你 需要 采取 另 一 种 完全 不 同 的 方法 。 


10.3.1 分 治 策略 的 作用 


说 来 奇怪 ， 找 到 一 个 更 好 的 排序 策略 的 关键 在 于 认识 到 像 选择 排序 类 算法 的 平方 级 行 
为 有 一 个 隐藏 的 优点 。 平 方 级 复杂 度 的 基本 特征 是 随 着 问题 规模 的 加 倍 ， 其 运行 时 间 将 增加 
4 倍 ， 反 之 亦 然 。 如 果 你 将 一 个 平方 级 的 问题 划分 成 两 个 问题 ， 那 么 运行 的 时 间 同 样 将 减少 
1/4。 这 个 事实 暗示 了 : 将 一 个 矢量 一 分 为 二 ， 然 后 再 运用 一 个 递归 的 分 治 算法 ， 可 能 会 减 
少 所 需 的 处 理 时 间 。 

为 了 使 这 个 想法 更 具体 ， 假 设 你 有 一 个 较 大 的 矢量 需要 对 其 元 素 进行 排序 。 如 果 你 将 这 
个 矢量 一 分 为 二 ， 并 且 对 其 每 一 部 分 使 用 选择 排序 算法 ,那么 将 会 发 生 什么 ”由 于 选择 排序 
算法 所 需 的 时 间 是 平方 级 的 ， 每 一 个 小 的 矢量 需要 原来 运行 时 间 的 1/4。 当 然 ， 你 需要 对 这 
两 部 分 分 别 排序 ， 但 是 处 理 这 两 个 小 的 矢量 总 共 所 需 的 时 间 仍 然 只 有 对 原来 矢量 进行 排序 所 
需 时 间 的 一 半 。 如 果 结 果 证 明 对 一 分 为 二 的 矢量 进行 排序 简化 了 对 一 个 完整 的 矢量 的 排序 问 
题 ， 你 将 能 够 大 幅度 地 减少 总 的 执行 时 间 。 更 重要 的 是 ， 一 旦 你 发 现在 一 个 层面 上 如 何 提高 
其 性 能 ， 你 就 可 以 使 用 相同 的 算法 来 对 每 部 分 进行 递归 排序 。 

为 了 确定 一 个 分 治 策略 是 否 适 合 于 排序 问题 ， 你 需要 回答 这 样 一 个 问题 : 将 一 个 矢量 划分 
成 两 个 小 的 矢量 ， 然 后 对 每 个 小 的 矢量 分 别 进行 排序 是 否 会 对 解决 一 般 问 题 有 所 帮助 。 作 为 一 
种 能 够 获得 对 这 个 问题 的 透彻 了 解 的 方法 ， 假 设 刚 开始 你 有 一 个 包含 了 以 下 8 个 元 素 的 矢量 : 


vec 
回回 加 本 本 四面 可 
0 1 2 3 4 5 6 7 


如 果 将 这 个 矢量 中 的 8 个 元 素 划 分 成 两 个 长 度 均 为 4 的 矢量 ,然后 再 对 这 两 个 小 的 矢量 进行 
HET GEE: 递归 的 稳步 跳跃 意味 着 你 可 以 假设 递归 调用 能 正确 地 工作 ) 例如 以 下 情况 ,每 
一 个 更 小 的 矢量 已 排序 : 


0 1 2 


上 述 分 解 有 什么 作用 呢 ? WE: 你 的 目的 是 从 这 些 更 小 的 矢量 中 取 值 ， 并 将 它们 放 到 原来 天 
量 中 的 正确 位 置 上 。 这 些 更 小 的 排序 好 的 矢量 是 如 何 帮助 你 实现 这 个 目标 的 ? 
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10.3.2 合并 两 个 矢量 


正如 所 发 生 的 一 样 ， 基 于 较 小 的 已 经 排序 好 的 矢量 重新 构建 完整 的 矢量 是 一 个 比 原 问 题 
更 简单 的 问题 。 其 中 所 需 的 技术 称 为 归并 ( merging)， 归 并 依赖 于 这 样 一 个 事实 : 最 终 排序 
后 的 首 元 素 一 定 是 v1 和 v2 首 元 素 中 的 那个 较 小 的 元 素 。 在 这 个 例子 中 ， 所 创建 的 新 的 矢 
量 中 的 首 元 素 是 v2 中 的 19。 如 果 把 这 个 元 素 添 加 进 一 个 空 的 vec H, MEE v2 中 将 其 删 
去 ， 并 得 到 以 下 结果 
vi 


PSTSTSTS] 


? 


四 
ee CIE [30 | E [95 | 


下 一 次 ，vec 中 的 下 一 个 元 素 只 能 是 两 个 小 的 矢量 中 未 使 用 过 的 第 一 个 元 素 。 这 次 , 将 v1 
中 的 25 与 v2 中 的 30 进行 比较 后 ， 选 择 了 前 者 : 


ü 1 2 3 


ne 
v2 
x| 30 | 73 | 95 | 
bg 30 73 95 
2X 
0 l 2 3 


可 以 通过 从 vi 或 者 v2 中 挑选 出 较 小 的 值 来 简单 地 继续 这 个 过 程 ， 直 到 重新 构建 了 完整 的 
矢量 为 止 。 


10.3.3 “归并 排序 算法 


归并 操作 与 递归 分 解 共 同 产生 了 一 种 称 为 归并 排序 (merge sort) 的 排序 算法 ， 已 证 明 它 
比 选择 排序 算法 具有 更 高 的 效率 。 归 并 排序 算法 的 基本 框架 如 下 : 

1. 查看 矢量 是 否 为 空 ， 或 者 是 否 其 仅 有 一 个 元 素 。 如 果 为 空 或 者 仅 有 一 个 元 素 ， 那 么 它 
一 定 已 经 排序 好 了 。 这 种 情况 定义 了 递归 的 简单 情况 。 

2. 否则 ， 将 矢量 划分 成 两 个 更 小 的 矢量 ， 每 一 个 小 的 矢量 大 小 只 有 原 矢量 对 象 的 一 半 。 

3. 对 每 个 较 小 的 矢量 进行 递归 排序 。 

4. 清空 原 矢 量 对 象 使 它 为 空 。 

5. 将 两 个 排序 好 的 小 矢量 进行 合并 ， 形 成 一 个 排序 好 的 原始 大 小 的 矢量 。 

图 10-3 展示 了 归并 排序 算法 的 代码 ， 其 功能 由 被 巧妙 地 划分 成 的 两 个 函数 sort 和 
merge 完成 。sort 函数 的 代码 直接 遵循 算法 框架 。 在 检查 完 特殊 情况 之 后 ， 算 法 将 原始 的 
矢量 划分 成 两 个 较 小 的 矢量 : v1 和 v2。sort 函数 代码 将 原 矢量 中 的 所 有 的 元 素 分 别 复制 
“vl 和 v2 后 ,然后 对 它们 分 别 进行 递归 排序 ， 清 空 原始 的 矢量 ， 再 调用 merge MARA 
在 原始 矢量 中 构造 出 所 有 的 元 素 排序 。 

函数 merge 以 待 排序 的 原始 矢量 及 划分 之 后 更 小 的 v1 和 v2 为 参数 ， 完 成 了 大 部 分 
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的 算法 。 索 引 pl 以 及 p2 标记 了 程序 在 每 一 个 划分 的 矢量 子 对 象 中 的 执行 位 置 。 对 于 每 一 
次 循环 ， 函 数 从 v1 或 者 v2 中 挑选 出 一 个 元 素 (这 个 元 素 是 它们 中 最 小 的 )， 并 且 将 这 个 值 
添加 进 vec 的 末尾 。 当 两 个 较 小 的 矢量 中 的 任意 一 个 元 素 为 空 时 ， 函 数 无 须 测 试 即 可 将 另 
外 一 个 矢量 中 的 剩余 元 素 拷贝 到 目标 vec 对 象 中 。 事 实 上 ， 由 于 当 第 一 个 while 循环 结束 
时 ， 其 中 一 个 矢量 的 元 素 已 经 耗 尽 ， 函 数 仅 将 其 他 的 每 个 矢量 中 剩余 的 元 素 拷贝 到 目标 对 


[A45] 象 。 这 些 矢量 中 的 任意 一 个 为 空 ， 因 此 所 对 应 的 while 循环 将 不 会 执行 。 


/* 


* 


* This function sorts the elements of the vector into increasing order 
* using the merge sort algorithm, which consists of the following steps: 
* 


l. Divide the vector into two halves. 
2. Sort each of these smaller vectors recursively. 
. Merge the two vectors back into the original one. 


void sort (Vector<int> & vec) ( 
int n = vec.size(); 
if (n <= 1) return; 
Vector<int> vl; 
Vector<int> v2; 
for (int i = 0; i < n; itt) ( 
af (£n 7.2) ( 
vl.add(vec[i]); 
) else ( 
v2.add(vec[i]); 
) 
) 
sort (v1); 
sort (v2); 
vec.clear(); 
merge(vec, vl, v2); 


Implementation notes: merge 


This function merges two sorted vectors, vl and v2, into the vector 
vec, which should be empty before this operation. Because the input 
vectors are sorted, the implementation can always select the first 
unused element in one of the input vectors to fill the next position. 


/ 


void merge (Vector<int> & vec, Vector<int> & vl, Vector<int> & v2) { 
int nl = vl.size(); 
int n2 - v2.size(); 
int pl - 0; 
int p2 - 0; 
while (pl < nl && p2 < n2) ( 
if (vl[pl] < v2[p2]) í 
vec.add (vl [pl++] ); 
] eise { 
vec.add (v2 [p2++]); 
} 
) 
while (pl < nl) vec.add(vl[pl**]); 
while (p2 < n2) vec.add(v2[p2**]); 





图 10-3 ”归并 排序 算法 的 实现 


10.3.4 ”归并 排序 的 计算 复杂 度 

你 现在 已 经 有 了 一 个 基于 分 治 策略 实现 的 sort 函数 。 它 的 效率 如 何 ? 可 以 通过 对 矢量 
中 的 数据 进行 排序 并 测试 其 执行 时 间 来 衡量 它 的 效率 ， 就 计算 复杂 度 来 说 ， 以 考虑 这 个 算法 
作为 开始 是 很 有 帮助 的 。 
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当 对 一 个 包含 X 个 数 的 列表 调用 以 归并 排序 实现 的 sort 函数 时 ， 其 运行 时 间 可 以 划分 
为 以 下 两 部 分 : 

1. 执行 当前 层 的 递归 分 解 中 的 操作 所 需 的 总 时 间 。 

2. 执行 递归 调用 所 需 的 时 间 。 

在 递归 分 解 的 顶层 ， 执 行 非 递归 操作 所 消耗 的 时 间 与 YX 成 正比 。 在 矢量 子 对 象 中 添加 
元 素 的 循环 执行 了 NM 次 ， 然 后 调用 函数 merge 以 便 在 矢量 中 原始 的 W 个 位 置 重新 添加 元 
素 。 如 果 你 添加 这 些 操作 并 且 忽 略 常量 因素 ， 会 发 现 对 sort 函数 的 任何 单 次 调用 的 复杂 度 
(不 包括 计算 其 内 部 的 递归 调用 ) 需要 O (N) 次 操作 。 

但 是 递归 操作 需要 花费 多 长 时 间 呢 ?为 了 对 一 个 长 度 为 N 的 矢量 中 的 元 素 进行 排序 ， 
必须 对 两 个 大 小 为 N/2 的 矢量 中 的 元 素 进行 递归 地 排序 ， 这 须 花 费 一 些 时 间 。 如 果 运 用 相 
同 的 逻辑 ， 在 当前 递归 分 解 层 次 上 ， 可 以 迅速 确定 对 每 一 个 小 的 矢量 进行 排序 所 需 的 时 间 与 
N/2 成 正比 ， 再 加 上 任何 更 下 层 的 递归 调用 所 需 的 时 间 。 相 同 的 过 程 继续 执行 ， 直 到 你 遇 到 
了 简单 情况 ， 即 矢量 仅 包 含 一 个 元 素 或 者 其 中 没有 元 素 。 

解决 这 个 问题 所 需 的 总 时 间 为 每 层 递 归 调 用 所 需 的 时 间 之 和 。 通 常 ， 图 10-4 展示 了 分 
解 的 结构 。 当 逐渐 降低 递归 层次 时 ， 矢 量 的 长 度 会 变 得 越 来 越 小 ， 同 时 矢量 的 个 数 也 会 变 得 
越 来 越 多 。 然 而 ， 在 每 层 上 所 需 做 的 总 工作 量 总 是 直接 与 X 成 正比 。 因 此 ， 确 定 算法 总 的 
工作 量 就 是 一 个 求 算法 分 解 到 底 有 多 少 层 的 问题 。 

在 层次 结构 中 的 每 一 层 中 ,把 的 值 除 以 2。 因 此 ， 层 的 总 数 等 于 在 N 减少 到 1 之 前 它 
能 被 2 整除 的 总 次 数 。 将 这 个 问题 表述 成 数学 形式 ， 你 需要 求 出 一 个 k 值 ， 使 得 下 式 成 立 : 
N—2* 

排序 一 个 大 小 为 N 的 矢量 


COCO) we 


排序 两 个 大 小 为 N/2 的 矢量 


TT sexe 


排序 四 个 大 小 为 W4 的 矢量 


COD CO CE ac 


排序 八 个 大 小 为 W8 的 矢量 


DCDCDOCDOECDOCDCDCD ww 
以 此 类 推 
10-4 ”归并 排序 的 递归 分 解 
解 这 个 关于 大 的 方程 ， 得 到 : 
k—log; N 


由 于 log; N 层 中 每 一 层 的 工作 总 量 都 与 Y 成 正比 ， 所 以 ， 工 作 总 量 与 dog; N 成 正比 。 

不 像 其 他 学 科 ， 对 数 可 表示 成 以 10 为 底 (常用 对 数 ) 或 者 是 以 数学 常量 e 为 底 (自然 对 
数 )， 计算机 科学 倾向 于 使 用 二 进 制 对 数 ( binary logarithm), €A 2 为 底 。 对 数 计算 使 用 不 
同 的 底 ， 区 别 仅 在 于 一 个 常量 因子 ， 因 此 ， 在 讨论 关于 时 间 复 杂 度 时 ， 传 统 的 方法 是 忽略 对 
数 的 底 。 因 此 ， 归 并 排序 的 算法 复杂 度 通常 表示 为 : 
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O (Nlog N) 


10.3.5 beg N’ Ej N log; N BERE 

与 O(N log N) 运行 时 间 的 算法 相 比 ， 需 要 O(N?) 运行 时 间 的 算法 哪 一 个 更 好 ? 评估 算 
法 性 能 改进 水 平 的 一 种 方法 是 查看 实验 数据 ， 通 过 比较 选择 排序 算法 与 归并 排序 算法 的 运行 
时 间 来 得 到 直觉 上 的 认识 。 图 10-5 显示 两 种 算法 执行 时 间 的 比较 实验 数据 。 当 排序 元 素 个 
JN K 10 时， 归并 排序 的 实现 比 选择 排序 的 实现 慢 了 5 倍 。 当 NS 100 时 ,选择 排序 仍然 
比 归 并 排序 快 ， 但 是 快 得 并 不 多 。 当 将 增加 到 100 000 时 ， 归 并 排序 比 选择 排序 快 了 几乎 
500 倍 。 在 我 的 计算 机 上 ， 选 择 排序 算法 需要 超过 两 分 半 钟 的 时 间 来 对 这 100 000 个 数 进行 
排序 ， 而 归并 排序 不 到 半 秒 就 完成 了 。 对 于 大 的 矢量 来 说 ， 归 并 排序 显然 标志 着 一 个 重大 的 
算法 性 能 改进 。 


选择 排序 算法 归并 排序 算法 
0.000 002 4 s 0.000 012 8 s 


N 
50 0.000 044 8 s 0.000 088 7 s 
100 0.000 169 s 0.000 196 s 
| so | 00005; 0.001 10 s 














1000 0.015 9 0.002 36 s 
5000 0.395 s 0.0129 s 
1.58 s 0.027 s 





39.6 s 0.156 s 


| 100000 | 1587s | 0324s | 
图 10-5 选择 和 归并 排序 算法 的 执行 时 间 实验 数据 比较 


可 以 通过 比较 两 个 算法 的 时 间 复 杂 度 公式 得 到 更 多 的 相同 信息 ， 如 下 所 示 : 


N N? N log N 
Ames A al ue 
| 100 | 1000 | 64 | 
| 1000 | 1000000 | 9965 | 


10 000 100 000 000 132 877 


随 着 入 变 大 ， 每 一 列 的 数字 都 变 大 ,但 是 和 N? 这 列 要 比 N log N 这 列 增长 得 快 得 多 。 因 此 ， 
对 于 长 度 范围 更 大 的 矢量 而 言 ， 基 于 N logo N 的 排序 算法 将 更 有 用 。 


10.4 ”标准 的 算法 复杂 度 类 别 

在 程序 设计 中 ， 大 多 数 算法 属于 一 些 常见 的 复杂 度 类 别 中 的 一 种 。 最 重要 的 复杂 度 类 别 
显示 在 图 10-6 中 ， 这 些 算法 复杂 度 类 别 都 有 统称 ， 并 且 有 相对 应 的 大 0 表达 式 以 及 一 个 代 
表 该 类 复杂 度 的 典型 算法 。 

图 10-6 中 的 类 别 是 严格 按照 复杂 度 的 递增 次 序 呈 现 的 。 如 果 你 需要 在 一 个 (log N) 时 
间 的 算法 与 另外 一 个 O(N) 时间 的 算法 之 间 做 出 选择 ， 随 着 的 变 大 ， 第 一 个 算法 总 是 
优 于 第 二 个 算法 。 当 NEUM, KO 计算 也 许 会 使 得 一 个 理论 上 低 效 的 算法 表现 出 低 复 
杂 度 。 另 一 方面 ， 随 着 N 变 大 ， 总 会 存在 这 样 一 个 点 : 效率 的 理论 区 别 会 成 为 决定 性 的 
因素 。 
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在 一 个 矢量 中 返回 第 一 个 元 素 
在 一 个 排序 好 的 矢量 中 进行 二 分 查找 
在 一 个 矢量 中 进行 线性 查找 


O (N) 




































O (N log N) 归并 排序 
O (N?) 选择 排序 
立方 传统 的 矩阵 相 乘 算法 
指数 汉 诺 塔 





图 10-6 标准 的 算法 类 别 


这 些 复杂 度 类 别 效 率 之 间 的 差别 实际 上 是 深奥 的 。 你 可 以 通过 查看 图 10-7 中 的 曲线 图 
来 认识 这 些 不 同 的 复杂 度 函 数 之 间 的 相互 关系 ， 这 个 图 将 这 些 复杂 度 函 数 绘制 在 一 个 传统 的 
线性 坐标 上 。 遗 憾 的 是 ， 由 于 的 值 都 很 小 ， 因 此 这 个 图 表示 的 是 一 个 不 完整 并 且 在 有 些 
部 分 是 误导 的 情况 。 毕 竟 ， 复 杂 度 的 分 析 与 Y 值 变 大 根本 上 是 密切 相关 的 。 图 10-8 展示 了 
绘制 在 一 个 对 数 尺度 上 的 相同 数据 ,这 对 于 你 理解 这 些 函 数 是 如 何在 一 个 更 广阔 范围 内 的 值 
增长 是 非常 有 帮助 。 





图 10-7 标准 的 算法 复杂 度 类 别 的 增长 特性 : 线性 平面 图 


算法 可 分 为 常量 、 线 性 、 平 方 、 立 方 复杂 度 类 别 ， 并 且 这 些 复杂 度 类 别 均 属 于 一 个 称 为 
多 项 式 算法 (polynomial algorithm) 的 系列 一 部 分 ， 对 于 某 个 常量 k 而 言 ， 该 类 算法 执行 时 
间 为 Ne。 其 中 一 个 有 用 的 性 质 是 : 在 图 10-8 的 对 数 坐 标 图 中 ,任何 N* 函数 的 图 形 总 是 一 
条 直线 ， 且 其 斜率 与 k 成 正比 。 观 察 图 10-8， 你 会 发 现 N* 的 函数 (无 论 k 有 多 大 ) 总 是 比 
以 2" 为 代表 的 指数 函数 增长 得 缓慢 ， 而 指数 函数 会 随 着 N 的 增长 持续 向 上 激增 。 这 个 性 质 
对 于 为 现实 问题 寻找 一 个 可 行 的 算法 有 着 重要 的 意义 。 尽 管 选 择 排序 展示 了 平方 算法 对 于 大 
N 有 着 严重 的 性 能 问题 ， 而 复杂 度 为 O (2) 的 算法 效率 则 更 加 低下 。 作 为 一 个 经 验 法 则 ， 
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O (Nlog N) 





图 10-8 标准 的 算法 复杂 度 类 别 的 增长 特性 : 对 数 平面 图 


计算 机 科学 家 将 是 否 存在 一 个 在 多 项 式 时 间 内 可 解 的 算法 问题 分 为 易于 处 理 的 (tractable) 
和 不 易于 处 理 的 (intractable)。 易 于 处 理 的 问题 意味 着 它们 适合 在 计算 机 上 实现 。 

遗憾 的 是 ， 商 业 上 许多 重要 的 问题 采用 我 们 所 知 的 算法 都 需要 指数 级 的 时 间 ， 其 中 一 
个 就 是 第 8 章 介 绍 的 子 集 求 和 问题 ， 它 来 源 于 几 个 实际 应 用 问题 。 另 外 一 个 就 是 旅行 商 问 
题 (traveling salesman problem )， 该 问题 是 寻找 这 样 一 条 最 短路 线 : 一 个 旅行 者 由 起 点 出 发 ， 
能 够 访问 由 多 个 码头 连接 的 入 个 城市 ， 最 后 再 回 到 原点 。 正 如 大 家 都 知道 的 ， 子 集 求 和 问 
题 与 旅行 商 问题 二 者 都 不 可 能 在 多 项 式 时 间 内 求解 。 所 有 最 著名 的 算法 在 最 坏 情况 下 都 具有 
指数 级 性 能 ， 并 且 在 生成 所 有 可 能 路 径 或 者 比较 其 代价 时 其 效率 都 是 相等 的 。 通 常 ， 对 上 述 
每 一 个 问题 的 求解 方法 是 尝试 每 一 种 可 能 ， 这 需要 指数 级 的 时 间 。 另 外 ， 没 有 人 能 够 确切 地 
证 明 对 这 个 问题 的 求解 存在 非 多 项 式 的 算法 。 也 许 存在 某 些 能 够 解决 这 些 问 题 的 更 聪明 的 算 
法 。 若 如 此 ， 现 在 认为 困难 的 许多 问题 将 会 变 为 可 解 的 。 

像 子 集 求 和 问题 或 者 旅行 商 问题 是 否 可 以 在 多 项 式 时 间 内 求解 这 一 问题 ， 是 计算 机 
科学 乃至 在 数学 中 的 一 个 最 重要 的 开放 性 问题 。 这 个 问题 称 为 P 与 NP 问题 (P versus NP 
problem) , 解决 这 类 难题 的 悬赏 奖金 高 达 一 百 万 美元 。 


10.5 快速 排序 算法 


即使 本 章 早 些 时 候 出 现 的 归并 排序 在 理论 上 效果 很 好 ,并且 有 一 个 最 坏 情况 的 复杂 度 
O (N log N), 但 该 算法 在 实际 中 并 不 常用 。 取 而 代 之 的 是 , 今天 所 使 用 的 大 多 数 排序 程序 
都 是 基于 一 种 称 为 快速 排序 的 算法 ， 它 是 由 英国 计算 机 科学 家 CAR GEE) BRAMAN. 

快速 排序 算法 以 及 归并 排序 算法 都 采用 了 分 治 策略 。 在 归并 排序 算法 中 ， 原 始 的 矢量 划 
分 成 两 部 分 ， 每 一 部 分 单独 地 排序 。 之 后 ， 将 它们 进行 归并 以 最 终 完成 矢量 的 排序 。 然 而 ， 
假设 你 采取 一 种 不 同 的 方法 来 划分 这 个 矢量 ， 如 果 你 通过 对 这 个 矢量 做 一 个 初始 的 遍历 作为 
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这 个 过 程 的 开始 ， 并 且 修 改元 素 的 位 置 ， 以 使 在 某 种 定义 上 “小 ”的 元 素 出 现在 矢量 的 开始 ， 
“大 ”的 元 素 出 现在 矢量 的 末尾 ， 那 么 将 会 发 生 什么 ? 
例如 ， 假 设 你 想 要 排序 的 矢量 的 初始 状态 正如 之 前 讨论 的 归并 排序 的 元 素 一 样 : 


vec 


0 1 2 3 4 5 6 7 
由 于 这 些 元 素 中 有 一 半 大 于 50， 而 另 一 半 比 50 小 得 多 ， 此 时 ， 定 义 那些 小 于 50 的 元 素 为 
小 ， 定 义 那些 大 于 等 于 50 的 元 素 为 大 是 有 意义 的 。 如 果 可 以 找 出 一 种 方法 来 重新 排列 这 些 
元 素 ， 以 便 所 有 小 的 元 素 出 现在 矢量 的 开头 而 所 有 的 大 的 元 素 出 现在 它 的 末尾 ， 那 么 就 能 把 
这 个 矢量 划分 为 下 图 所 示 的 形式 ， 该 划分 显示 了 一 种 可 能 的 划分 ， 其 中 小 的 元 素 以 及 大 的 元 
素 分 别 出 现 在 划分 边界 的 两 侧 : 


ym | 25 | 37 |30 s6 
0 1 2 3 | 4 5 6 7 
小 的 元 素 : 大 的 元 素 


当 矢 量 中 的 元 素 以 这 种 方式 被 划分 成 两 部 分 后 ， 剩 下 要 做 的 就 是 排序 每 一 部 分 的 元 素 ， 这 可 
以 递归 调用 排序 算法 。 由 于 在 分 界 左 边 的 所 有 的 元 素 都 小 于 其 右边 的 元 素 ， 所 以 最 终 的 结果 
将 会 是 一 个 完全 排 好 序 的 矢量 : 


ols Tol «TeTsTs 
0 1 2 3 $ 4 5 6 7 
小 的 元 素 | 大 的 元 素 


如 果 在 每 一 次 循环 中 ， 你 总 能 在 “小 ”元 素 与 “大 ”元 素 之 间 选 择 一 个 最 优 的 边界 ， 那 
么 这 个 算法 每 一 次 都 会 将 矢量 划分 成 一 半 ， 并 且 具 有 和 归并 排序 算法 等 价 的 性 能 。 事 实 上 ， 
快速 排序 算法 会 挑选 某 个 矢量 中 已 经 存在 的 元 素 ， 并 且 用 它 的 值 代表 在 “大 ”元 素 和 “小 ” 
元 素 之 间 的 分 界线 。 然 而 在 这 个 练习 中 ， 你 有 机 会 探索 更 高 效 的 策略 ， 策 略 之 一 就 是 挑选 第 
一 个 元 素 (原始 矢量 中 的 56 )， 并 且 使 用 其 值 作为 边界 值 。 当 这 个 矢量 被 重新 排序 时 ， 这 个 
边界 值 将 取 一 个 特定 的 索引 值 ， 而 不 是 处 于 分 界线 两 边 的 位 置 之 间 ， 如 下 图 所 示 : 


ss Tn Tw [S Ts [n [s 
0 1 2 3 4 5 6 7 


就 此 看 来 ， 这 个 递归 调用 一 定 在 矢量 的 索引 位 置 0 与 3 之 间 ， 以 及 在 索引 位 置 5 与 7 之 间 对 
其 元 素 进行 排序 ， 其 中 ， 索 引 位 置 4 是 矢量 的 分 界线 。 

正如 归并 排序 ， 快 速 排 序 的 简单 情况 是 已 排序 好 的 大 小 为 0 或 1 的 矢量 。 快 速 排序 算法 
的 递归 部 分 由 下 面 的 步骤 构成 : 

1. 选择 一 个 元 素 作 为 “大 ”元 素 和 “小 ”元 素 之 间 的 边界 。 这 个 元 素 在 传统 上 被 称 为 基 
HE (pivot)。 到 目前 为 止 ， 选 择 任何 元 素 充 当 这 个 基准 都 是 充分 的 ， 但 是 最 简单 的 策略 就 是 
选择 矢量 中 的 首 元 素 作为 基准 。 
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2. 对 矢量 中 的 元 素 重新 排序 ， 以 便 “ 大 ”的 元 素 移动 到 矢量 的 末尾 ， 而 “小 ”的 元 素 移 
动 到 失 量 的 开头 。 更 正式 地 说 ， 这 一 步 的 目的 是 : 将 元 素 划 分 到 基准 的 周围 ， 从 而 使 得 在 边 
界线 左边 的 所 有 元 素 都 小 于 基准 ， 而 在 边界 线 右边 的 所 有 元 素 都 大 于 或 等 于 基准 ， 这 个 过 程 
被 称 为 划分 (partitioning) 矢量 ， 它 将 会 在 下 节 进 行 详 细 讨 论 。 

3. 将 划分 的 每 一 部 分 的 矢量 元 素 进行 排序 。 由 于 所 有 出 现在 基准 边界 左边 的 元 素 都 要 严 
格 地 比 其 右边 的 元 素 小 ， 因 此 ， 对 基准 边界 划分 的 每 一 部 分 的 矢量 元 素 进行 排序 ， 将 使 得 整 
个 矢量 元 素 处 于 有 序 。 此 外 ， 由 于 算法 使 用 了 分 治 策略 ， 这 些 被 划分 为 更 小 的 矢量 可 以 采用 
递归 的 快速 排序 来 进行 排序 。 


10.5.1 划分 矢量 


在 快速 排序 算法 的 划分 步骤 中 ， 其 目的 是 对 元 素 重 新 排序 ， 从 而 使 它们 可 被 划分 成 三 种 
类 型 : 那些 比 基 准 小 的 元 素 ; 位 于 边界 位 置 的 基准 元 素 本 身 ; 那些 大 于 等 于 基准 元 素 的 元 素 。 
划分 的 琼 手 部 分 在 于 : 在 不 能 使 用 任何 额外 的 存储 空间 的 前 提 下 ， 对 这 些 元 素 重新 排序 ， 实 
现 它 的 典型 方法 是 通过 交换 一 对 元 素来 完成 的 。 

托尼 ' 堆 尔 初始 的 划分 方法 正好 可 以 用 英语 做 简单 的 解释 。 和 之 前 章节 一 样 ， 后面 的 讨 
论 假设 基准 元 素 为 矢量 的 首 元 素 。 由 于 在 算法 划分 阶段 开始 之 前 ， 基 准 元 素 的 值 已 被 选择 ， 
因此 你 可 以 立即 区 分 一 个 元 素 值 相对 于 基准 元 素 是 “大 ”还 是 “小 ”。 托 尼 的 划分 算法 以 如 
下 步骤 执行 : 

1. 此 时 ,忽略 处 于 索引 位 置 0 的 基准 元 素 ， 把 精力 放 在 剩 下 的 元 素 中 。 使 用 两 个 索引 值 
lh 和 rh 来 记录 矢量 中 剩余 元 素 的 开始 索引 位 置 与 未 尾 索引 位 置 ， 如 下 图 所 示 : 


| 
spSTSTR TS [s [5 [e 
oO 1 2 3 4 5 6 7 
Ki g 
lh rh 


2.4% rh 向 左 移动 ， 直 到 与 1h 一 致 ， 或 者 指向 一 个 所 包含 的 值 小 于 基准 元 素 值 的 元 素 。 
在 此 例 中 ， 索 引 位 置 7 的 元 素 值 30 已 是 一 个 小 值 ， 所 以 rh 索引 不 需要 移动 。 

3. 将 lh 向 右 移动 ， 直 到 与 rh 相同 ， 或 者 指向 一 个 所 包含 的 值 大 于 基准 元 素 值 的 元 素 。 
在 此 例 中 ，1h 索引 必须 向 右 移 动 ， 直 到 它 指向 一 个 其 值 大 于 56 的 元 素 ， 得 到 了 如 下 所 示 的 


结构 : 
[s npe 四 上 本 | 可 | 各 | 
1 2 3 4 5 6 7 
外 8 


0 


lh rh 


4. 如 果 lh 和 rh 索引 没有 达到 相同 的 位 置 ， 将 lh 5 rh 位 置 所 指 的 元 素 进行 交换 ， 得 
到 矢量 中 的 内 容 变 为 下 图 所 示 的 情形 : 


(56 |25 |37 [3o [9s | 19 | 73 | 58 | 
0 1 2 3 4 5 6 7 
t g 

ih rh 


5. 重 复 步 又 2 一 4， 直 到 1n 和 rh 相遇 为 止 。 例 如 ， 在 下 一 次 索引 位 置 移动 过 程 中 ， 第 
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4 步 的 交换 操作 将 19 5 95 交换 。 当 这 种 情况 发 生 时 ， 下 一 次 的 步 又 2 会 将 rh 向 左 移动 ， 
直到 与 Lh 匹配 为 止 ， 如 下 图 所 示 : 


TsTSTS IS TSTS Tw 
”一 场 2 3 4 5 6 7 
Ej 


lh+rh 





6. 除非 选择 的 基准 元 素 恰好 是 整个 矢量 中 最 小 的 元 素 (这 段 代 码 中 应 该 包含 对 这 种 情况 
的 一 个 特殊 检查 )， 和 否则 ，1lh 与 rh 索引 位 置 所 指 的 元 素 将 会 是 矢量 右边 元 素 的 最 小 值 。 剩 
下 的 一 步 就 是 将 这 个 值 与 出 现在 矢量 开始 的 基准 元 素 相交 换 ， 如 下 图 所 示 : 


| 19 | 25 | 37 | 30 | s6 | 95 | 73 |s | 
0 1 2 3 4 5 6 7 
t 


边界 


注意 : 至 此 矢量 中 这 个 结构 满足 划分 步骤 的 需求 。 基 准 值 被 标记 在 边界 位 置 ， 边 界 位 置 
左边 的 每 一 个 元 素 都 比 基 准 元 素 值 小 ， 而 其 右边 的 每 一 个 元 素 都 比 基 准 元 素 值 大 。 
图 10-9 展示 的 是 采用 快速 排序 算法 实现 的 一 个 sort 函数 。 


This function sorts the elements of the vector into 
increasing numerical order using the Quicksort algorithm. 
In this implementation, sort is a wrapper function that 
calls quicksort to do all the work. 


void sort (Vector<int> & vec) { 
quicksort(vec, 0, vec.size() - 1); 


Implementation notes: quicksort 


This function sorts the elements in the vector between index 
positions start and finish, inclusive. The Quicksort algorithm 
begins by "partitioning" the vector so that all elements smaller 
than a designated pivot element appear to the left of a 
boundary and all equal or larger values appear to the right. 
Sorting the subsidiary vectors to the left and right of the 
boundary ensures that the entire vector is sorted. 


void quicksort (Vector<int> & vec, int start, int finish) { 
if (start »- finish) return; 
int boundary - partition(vec, start, finish); 
quicksort(vec, start, boundary - 1); 
quicksort(vec, boundary * 1, finish); 


Implementation notes: partition 


This function rearranges the elements of the vector so that the 
small elements are grouped at the left end of the vector and the 
large elements are grouped at the right end. The distinction 
between small and large is made by comparing each element to the 
pivot value, which is initially taken from vec[start]. When the 
partitioning is done, the function returns a boundary index such 
that vec[i] « pivot for all i « boundary, vec[i] -- pivot 

for i == boundary, and vec[i] >= pivot for all i > boundary. 


/ 
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图 10-9 快速 排序 算法 的 实现 
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int partition(Vector«int» & vec, int start, int finish) ( 
int pivot - vec[start]; 
int lh = start + 1; 
int rh - finish; 
while (true) ( 
while (lh < rh && vec[rh] >= pivot) rh--; 
while (lh < rh && vec[lh] < pivot) lh++; 
if (1h -- rh) break; 
int tmp - vec[1h]; 
vec[lh] = vec[rh]; 


vec[rh] = tmp; 


) 

if (vec[lh] >= pivot) return start; 
vec[start] = vec[lh]; 

vec[lh] = pivot; 

return lh; 





图 10-9 (28) 


10.5.2 ”快速 排序 算法 的 性 能 分 析 


图 10-10 中 出 现 的 是 归并 排序 与 快速 排序 算法 实际 运行 时 间 的 一 个 直接 比较 。 正 如 你 所 
看 到 的 那样 ， 快 速 排序 的 实现 常常 比 图 10-3 中 的 归并 排序 运行 速度 快 几 倍 ， 这 也 是 程序 员 
在 实际 中 更 加 频繁 使 用 快速 排序 算法 的 原因 之 一 。 此 外 ， 两 种 算法 的 运行 时 间 以 大 致 相同 的 
方式 增长 。 

然而 ， 图 10-10 中 所 显示 的 实验 结果 隐藏 了 一 个 要 点 。 如 果 快 速 排序 算法 选择 的 基准 接 
近 于 矢量 的 中 间 值 ， 那 么 划分 步 又 将 会 把 矢量 划分 成 大 小 差不多 相等 的 两 部 分 。 否 则 ， 所 划分 
的 两 部 分 中 的 一 个 部 分 可 能 要 比 另 外 一 部 分 大 得 多 ， 这 也 就 违背 了 分 治 策略 的 目标 。 在 一 个 矢 
量 中 ， 随 机 地 选择 一 个 元 素 作 为 其 基准 元 素 ， 则 快速 排序 往往 表现 得 很 好 ， 具 有 O(N log N) 
的 平均 复杂 度 。 最 差 的 情况 (也 就 是 一 个 矢量 中 的 元 素 早已 有 序 )， 算 法 的 性 能 会 退化 到 
O (NM”)。 除 最 坏 情况 ， 快 速 排序 实际 上 要 比 其 他 大 多 数 的 排序 算法 快 得 多 ， 因 此 对 于 大 多 
数 排序 程序 来 说 ， 快 速 排 序 已 成 为 通用 排序 过 程 的 一 个 标准 选择 。 


归并 排序 快递 排序 














N 
[io | &eoonss [0.000001 45 | 
[5 | a.000088 7s | oowozos | 
[ 10 | 6019s | 0.000 02885 | 
[ so | oo | 9020s 
[309 | ~o.00236s — | 0456s | 
[ 59 | sons | ow2Ms | 
50000 | orses — | 0065s | 


图 10-10 ”归并 排序 与 快速 排序 的 实验 性 能 比较 


这 里 有 几 种 可 供 你 使 用 的 策略 ， 以 提高 基准 在 实际 中 接近 矢量 中 间 值 的 可 能 性 。 一 种 最 简 
单 的 方法 是 在 快速 排序 的 实现 中 随机 地 选择 基准 。 尽 管 在 随机 选择 基准 过 程 中 仍然 有 可 能 选择 
了 一 个 次 优 的 基准 值 ， 但 是 在 递归 分 解 中 的 每 层 ， 每 次 不 可 能 重复 地 产生 这 一 相同 的 错误 。 此 
外 ， 原 始 矢量 中 的 分 布 并 不 总 是 最 坏 情况 。 对 于 任何 输入 来 说 ， 随 机 地 选择 基准 确保 了 算法 的 
平均 复杂 度 将 会 为 O(N log N)。 另 外 一 个 可 能 的 策略 就 是 在 矢量 中 挑选 出 一 些 值 ， 典 型 的 是 
3 个 或 5 个 ， 然 后 挑选 出 这 些 值 的 中 间 值 作为 基准 ， 你 可 以 在 习题 6 中 仔细 地 研究 这 个 策略 。 
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当 你 试图 用 这 种 方式 改进 算法 的 时 候 你 要 小 心 。 挑 选 出 一 个 好 的 基准 会 提高 算法 性 能 ， 
但 同时 也 需 花 费 一 些 时 间 。 如 果 算 法 在 选择 基准 时 所 花费 的 时 间 比 其 所 提高 算法 性 能 的 时 间 
要 长 ， 你 应 该 结束 这 种 基准 选择 方法 的 实现 ， 而 不 应 为 加 速 该 实现 为 目标 。 


10.6 ”数学 归纳 法 
在 本 章 的 前 面 小 节 ， 我 要 求 你 相信 这 个 事实 ， 以 下 的 求 和 
N 十 N-1 十 N-2 十 … 十 3 十 2 十 1 
可 以 简化 成 更 便于 处 理 的 公式 : 
N?+N 
2 
如 果 你 对 这 个 简化 有 所 怀疑 ， 你 如 何 来 证 明 这 个 简化 公式 在 实际 中 是 正确 的 呢 ? 
事实 上 ， 这 里 有 几 种 不 同 的 你 可 以 尝试 使 用 的 证 明 方法 。 其 中 一 种 可 能 就 是 以 几何 形式 
来 表达 这 个 原始 的 求 和 。 例 如 ， 假 设 EP S. 然后， 如 果 你 将 求 和 表达 式 中 的 每 一 项 表示 
成 一 行 圆 点 ， 这 些 圆 点 形成 了 以 下 三 角形 : 
0000o 
@@@@ 
@@@ 
o0 
e 


如 果 你 拷贝 这 个 三 角形 并 对 其 进行 翻转 ， 那 么 这 两 个 三 角形 的 组 合 形成 了 一 个 矩形 ， 下 图 用 
灰色 表示 了 下 面 的 三 角形 : 





由 于 这 个 图 案 现 在 是 一 个 和 矩形， 其 总 的 圆 点 数 (包括 黑色 以 及 灰色 ) 很 容易 计算 。 在 这 张 图 
中 ， 总 共有 五 行 ， 并 且 每 一 行 都 有 六 个 圆 点 ， 所 以 两 种 颜色 的 圆 点 总 数 就 是 SX6， 也 就 是 
30。 由 于 这 两 个 三 角形 是 完全 相同 的 ， 并 且 这 些 圆 点 中 的 一 半 恰 好 是 黑色 的 ， 因 此 ， 黑 色 圆 
点 的 数目 就 是 30/2， 即 15。 在 更 普遍 的 情况 下 ， 这 里 有 X 行 ， 并 且 每 一 行 包 含 了 N+1 个 圆 
点 ， 则 原始 三 角形 中 黑色 圆 点 的 数目 就 是 : 

ALLE 


然而 ， 用 这 种 方式 证 明 一 个 公式 是 正确 的 有 一 些 潜在 的 缺陷 。 其 中 一 个 缺陷 就 是 : 在 这 
公式 中 的 几何 参数 并 非 是 许多 计算 机 科学 家 想 要 的 形式 。 此 外 ,构建 这 种 类 型 的 参数 需要 你 
想 出 正确 的 几何 透视 ， 而 这 对 于 每 一 个 问题 都 是 不 同 的 。 采 用 一 个 更 普遍 的 证 明 策略 ， 从 而 
能 应 用 于 许多 不 同 的 问题 会 更 好 。 

计算 机 科学 家 们 通常 采用 证 明 以 下 这 一 命题 的 方法 被 称 为 数学 归纳 法 ( mathematical 


induction ): 
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N+ N- + N-25:::34241 = Wed 


数学 归纳 法 应 用 于 : 当 你 想 要 展示 一 个 命题 对 于 一 个 整数 W 从 某 个 初始 点 开始 的 所 有 
值 都 是 正确 的 。 这 个 初始 起 点 被 称 为 归纳 的 基 (basis)， 典 型 的 是 0 或 1。 这 个 过 程 包含 以 下 
步骤 : 

e 证 明基 本 情况 。 第 一 步 是 证 明 当 N 为 基 值 时 ， 这 个 命题 是 正确 的 。 在 大 多 数 情况 中 ， 

这 一 步 仅仅 是 将 基 值 带 入 一 个 公式 ， 并 且 查 看 所 期 望 的 关系 是 否 成 立 。 
e 证 明 归 纳 情 况 。 第 二 步 是 证 明 如 果 你 假设 这 个 公式 对 于 X 是 正确 的 ,那么 它 对 N+ 
也 是 正确 的 。 
作为 一 个 例子 ， 这 里 向 你 展示 如 何 使 用 数学 归纳 法 来 证 明 以 下 公式 : 
N+N-1+N-2+-°°°+34+24+1 = LRL 
对 于 所 有 大 于 等 于 1 时 ， 它 确实 是 正确 的 。 第 一 步 就 是 证 明基 本 情况 ， 此 时 和 N 等 于 1。 这 
步 证 明 是 非常 容易 的 ， 你 所 要 做 的 就 是 在 公式 的 两 边 用 1 代替 NW， 然 后 对 等 式 两 边 求 值 : 
_ IxQ+l) . 2 
] = Sehr L2 1S = 


2 2 
为 了 证 明 归纳 情况 ， 你 首先 假设 以 下 命题 对 于 N 是 正确 的 : 
N+ NA + N2+4+°°°+34+2+1 = MD 


这 个 假设 被 称 为 归纳 假设 (inductive hypothesis)。 你 现在 的 目标 是 证 明 : 对 于 N+1 来 
说 ,命题 也 是 成 立 的 。 换 句 话 说 ， 为 了 证 明 当 前 公式 的 正确 性 ， 你 需要 做 的 就 是 证 明 以 下 
Ax a 
N+1 +N+N-1+N-2+°°°+34+2+4+1 = hls 


如 果 观 察 等 式 的 左边 ， 应 该 注意 到 : 以 X 开 始 的 项 的 序列 和 你 的 归纳 假设 左边 的 部 分 是 完全 
相同 的 。 由 于 你 假设 了 归纳 假设 是 正确 的 ， 你 可 以 用 解析 表达 式 等 价 地 替换 ， 因 此 你 试图 证 
明 的 命题 的 左边 如 下 所 示 : 

N+1 + ND 


从 这 里 开始 ， 剩 余 的 证 明 就 是 简单 的 代数 运算 : 





N2z+3N+2 
2 
_ (N+1)x(N+2) 
2 
这 个 推导 的 最 后 一 行 恰恰 是 你 正在 寻找 的 结果 ， 因 此 整个 证 明 完 毕 。 


许多 学 生 需 要 花 时 间 来 适应 数学 归纳 法 的 思想 。 乍 一 看 ， 归 纳 假设 在 某 种 程度 上 看 起 
来 像 是 “欺骗 " ; 毕竟 ， 你 的 假设 正 是 你 想 要 证 明 的 命题 。 实 际 上 ， 数 学 归纳 法 的 过 程 只 不 
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过 是 证 明 的 一 个 无 限 族 ， 无 限 族 中 的 每 一 个 都 以 相同 的 逻辑 进行 。 一 个 典型 的 例子 就 是 基本 
情况 证 明了 对 于 N= 命题 是 正确 的 。 一 旦 你 已 经 证 明了 基本 情况 ， 你 可 以 采取 下 面 的 一 串 
推理 : 

既然 我 已 经 知道 了 N= 二 1 对 于 公式 是 正确 的 ， 可 以 证 明和 N==2 对 于 公式 也 是 正确 的 。 

既然 我 已 经 知道 了 N= 二 2 对 于 公式 是 正确 的 ， 可 以 证 明 N—3 对 于 公式 也 是 正确 的 。 

既然 我 已 经 知道 了 N—3 对 于 公式 是 正确 的 ， 可 以 证 明 N—4 对 于 公式 也 是 正确 的 。 

既然 我 已 经 知道 了 N=4 对 于 公式 是 正确 的 ， 可 以 证 明 N—5 对 于 公式 也 是 正确 的 。 
上 述 过 程 的 每 一 步 ， 你 都 可 以 通过 运用 证 明 归 纳 情况 的 逻辑 写 出 一 个 完整 的 证 明 。 数 学 归纳 
法 的 力量 来 自 于 这 样 一 个 事实 : 你 实际 上 并 不 需要 单独 写 出 每 一 步 的 细节 。 

在 某 种 程度 上 ， 数 学 归纳 法 的 过 程 看 起 来 像 是 反方 向 的 递归 过 程 。 如 果 你 试图 详细 地 解 
释 一 个 典型 的 递归 分 解 ， 这 个 过 程 经 常 听 起 来 像 这 样 : 

为 了 计算 N=5 时 的 函数 值 ， 我 需要 知道 N—4 时 的 函数 值 。 

为 了 计算 N=4 时 的 函数 值 ， 我 需要 知道 N—3 时 的 函数 值 。 

为 了 计算 N=3 时 的 函数 值 ， 我 需要 知道 N—2 时 的 函数 值 。 

为 了 计算 N—2 时 的 函数 值 ， 我 需要 知道 N— 1 时 的 函数 值 。 

N=1 代表 了 一 种 简单 情况 ， 所 以 我 可 以 迅速 地 返回 结果 。 

归纳 法 以 及 递归 都 需要 你 进行 一 个 信心 的 飞 牙 。 当 你 编写 一 个 递归 函数 时 ， 这 个 转变 要 
求 你 相信 函数 调用 的 所 有 简单 情况 都 可 以 工作 ， 而 无 须 关 注 其 细节 。 做 出 归纳 假设 需要 很 多 
相同 的 心智 训练 。 在 两 种 情况 下 ， 你 必须 将 你 的 思维 一 直 限 制 在 一 个 解决 方案 的 层面 上 ， 而 
不 能 在 求解 过 程 中 陷入 到 细节 中 。 


本 章 小 结 

本 章 你 所 获得 的 最 有 价值 的 概念 就 是 : 处 理 一 个 问题 的 不 同 算法 在 其 各 自 的 性 能 上 有 很 
大 的 变化 。 选 择 一 个 复杂 度 性 能 好 的 算法 可 以 减少 对 许多 排序 问题 处 理 所 需 的 时 间 。 通 过 本 
章 中 所 呈现 的 表格 ， 显 著 地 说 明了 不 同 排序 算法 的 实际 运行 的 不 同 的 时 间 性 能 。 例 如 ， 当 对 
一 个 含有 10 000 个 整数 的 矢量 进行 排序 时 ， 快 速 排序 比 选择 排序 快 250 倍 ; 随 着 矢量 尺寸 
的 增 大 ， 这 些 算法 在 效率 上 的 不 同 将 变 得 更 加 明显 。 

本 章 中 的 其 他 要 点 包括 : 
大 多 数 算法 问题 可 以 通过 一 个 代表 该 问题 大 小 的 整数 入 来 刻画 。 对 于 那些 大 的 整数 ， 
整数 的 大 小 提供 了 一 种 有 效 描述 问题 规模 的 方法 ; 且 该 类 算法 是 对 数组 或 者 矢量 进 
行 操作 的 ， 问 题 规模 常用 元 素 的 数目 来 定义 。 
对 效率 最 有 效 的 测量 方法 就 是 时 间 复 杂 度 ， 它 被 定义 为 问题 的 规模 与 随 着 问题 规模 


增加 的 算法 性 能 之 间 的 关系 。 
e KO 表示 法 提供 了 一 个 直观 的 表示 时 间 复 杂 度 的 方法 ， 因 为 它 允 许 将 复杂 度 关系 最 
重要 的 方面 简化 成 最 简单 的 形式 。 


当 你 使 用 大 O 表示 法 时 ， 你 可 以 通过 删除 公式 中 那些 随 着 N 的 变 大 变 得 无 关 紧 要 的 
项 以 及 所 有 的 常量 项 来 简化 公式 。 

你 可 以 通过 观察 一 个 程序 所 包含 的 循环 的 内 部 结构 来 预测 这 个 程序 的 时 间 复 杂 度 。 
测量 复杂 度 的 两 种 有 效 的 测量 方法 就 是 最 坏 情 况 分 析 以 及 平均 情况 分 析 。 平 均 情况 


314 # 10*X 





分 析 通 常 很 难 进行 。 
e 分 治 策略 能 够 将 排序 算法 的 复杂 度 从 O(N?) 降低 到 O (N log N)， 这 是 一 种 重要 的 
性 能 改进 。 
e 大 多 数 算法 都 属于 几 种 常见 复杂 度 算法 类 别 中 的 一 个 ， 这 些 常 见 的 复杂 度 类 别 算法 
包括 : 常量 、 对 数 、 线 性 、N log N、 二 次 方 、 三 次 方 ， 以 及 指数 这 些 类 别 。 至 少 当 
问题 被 考虑 成 足够 大 时 ， 出 现在 这 个 列表 中 较 前 的 算法 的 复杂 度 类 别 要 比 出 现在 这 
个 列表 中 后 面 的 时 间 复 杂 度 类 别 更 高 效 。 
如 果 问 题 可 以 在 多 项 式 时 间 内 求解 ， 会 被 定义 成 关于 一 些 常量 k 的 多 项 式 O (N*), 
这 是 易于 处 理 的 。 不 存在 多 项 式 时 间 算 法 的 问题 被 认为 是 不 易于 处 理 的 ， 因 为 即使 
问题 的 规模 相对 来 说 较 小 ， 处 理 那样 的 问题 也 需要 大 量 的 时 间 。 
由 于 快速 排序 算法 在 实际 中 往往 表现 得 很 好 ， 因 此 大 多 数 排序 问题 都 是 基于 由 托 
JE - 霍 尔 开发 的 快速 排序 算法 的 ， 虽 然 它 的 最 差 复杂 度 是 O (N7). 
数学 归纳 法 提供 了 一 种 通用 的 技术 ， 以 证 明 一 个 适用 于 所 有 大 于 或 等 于 一 些 基 值 
的 V 值 的 性 质 。 为 了 应 用 这 种 技术 ， 第 一 步 是 在 基本 情况 下 证 明 这 个 性 质 。 第 二 
步 ， 你 必须 证 明 如 果 这 个 公式 对 于 一 个 特殊 值 X 是 成 立 的 ， 那 么 它 对 于 N+1 也 是 成 
立 的 。 


复习 题 
1. 斐 波 那 契 函数 最 简单 的 递归 实现 与 其 迭代 版 本 的 实现 相 比 ， 被 认为 是 低 效 的 。 这 个 事实 是 否 可 让 你 
得 出 一 些 关于 递归 解决 方案 的 效率 以 及 迭代 解决 方案 效率 的 一 般 性 结论 呢 ? 
. 什么 是 排序 问题 ? 
.图 10-1 展示 的 sort 函数 的 实现 ， 即 使 在 1n 与 rh 的 位 置 值 相 等 的 情况 下 也 能 运行 代码 来 交换 1h 
与 rh 位 置 的 元 素 值 。 如 果 你 修改 代码 以 便 代 码 在 做 出 交换 前 进行 检查 ， 确 保 lh 与 rh 位 置 值 是 不 
同 的 ， 那么 很 可 能 比 原始 的 算法 运行 得 更 慢 。 为 什么 会 出 现 这 种 情况 ? 
.假如 你 正在 使 用 选择 排序 算法 对 一 个 含有 250 个 值 的 矢量 进行 排序 ， 并 且 发 现 该 算法 花费 了 50 毫秒 
的 计算 时 间 。 如 果 在 相同 的 机 器 上 使 用 相同 的 算法 对 一 个 含有 1000 个 值 的 矢量 进行 排序 ， 你 期 望 
的 运行 时 间 是 多 少 ? 
. 对 于 计算 以 下 序列 和 ， 它 的 解析 表达 式 是 什么 ? 

N-N - IN 224-3421 
6. 用 你 自己 的 语言 来 定义 时 间 复 杂 度 的 概念 。 
7. 判断 题 : 大 O 符号 是 作为 表达 时 间 复 杂 度 的 一 种 方式 被 发 明 的 。 
8. 本 章 中 简化 大 O 表示 所 提出 的 两 种 规则 是 什么 ? 


9 选择 排序 算法 的 运行 时 间 是 0 (I. ， 这 种 说 法 在 理论 上 是 正确 的 吗 ?如 果 不 是 的 话 ， 那 么 以 
这 种 形式 表达 的 时 间 复 杂 度 有 什么 问题 ? 
10. 选择 排序 的 运行 时 间 是 O ( N3 )， 这 种 说 法 在 理论 上 是 正确 的 吗 ? 如 果 不 正 确 ， 那 么 以 这 种 形式 表 
达 的 选择 排序 算法 有 什么 问题 ? 
11. 为 什么 通常 在 大 O 符号 中 省 略 对 数 的 底 ， 例 如 O (N log N) ? 
12. 下 面 函 数 的 时 间 复 杂 度 是 多 少 ? 
int mysteryl(int n) ( 
int sum - 0; 
for (int i = 0; i < n; itt) í 
for (int j = 0; j « i; j++) 4 


w N 


人 


wn 


A xe 


sum += i * j; 
) 
) 
return sum; 


} 
13. Fifi PBK AY At TR] A ZEE Fe Ip? 


int mystery2 (int n) ( 
int sum = 0; 
for (int i = 07 i < 10; i44) { 
for (int j = 07 j < i; jtt) { 
sum += j * n; 
) 
} 
return sum; 


} 
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14. 解释 最 坏 情况 下 时 间 复 杂 度 和 平均 情况 下 时 间 复 杂 度 之 间 的 不 同 。 通 常情 况 下 ， 这 些 度量 中 哪个 较 


难以 计算 ? 
15. 在 大 O 符号 的 形式 化 定义 中 ， 解 释 常 量 C 以 及 No 的 作用 。 
16. 用 你 自己 的 语言 解释 为 什么 merge 函数 的 运行 时 间 是 线性 时 间 。 
17. merge PREIS AG PITT: 
while (pl « nl) vec.add(vl[pl**]); 
while (p2 < n2) vec.add(v2[p2**]); 
如 果 这 两 行 代码 互 换 位 置 会 发 生 什么 ? 解释 为 什么 会 发 生 或 为 什么 不 会 发 生 ? 
18. 本 章 标识 的 七 种 在 实际 中 最 常见 的 复杂 度 类 别 是 什么 ? 
19. 多 项 式 算 法 这 个 术语 的 含义 是 什么 ? 
20. 计算 机 科学 家 区 分 易于 处 理 和 不 易于 处 理 的 问题 所 使 用 的 标准 是 什么 ? 
21. 在 快速 排序 算法 中 ， 划 分 步骤 的 结果 必须 满足 什么 条 件 ? 
22. 快速 排序 算法 的 最 坏 情况 及 平均 情况 的 时 间 复 杂 度 分 别 是 多 少 ? 
23. 描述 采用 数学 归纳 法 所 涉及 的 两 步 证 明 。 
24. 用 你 自己 的 语言 描述 递归 与 数学 归纳 法 之 间 的 关系 。 


习题 
L 编写 一 个 递归 函数 : 


double raiseToPower (double x, int n) 
通过 依赖 以 下 递归 公式 来 计算 x”: 


Xr xt 


这 样 的 一 个 策略 产生 了 一 个 以 线性 时 间 运 行 的 实现 。 然 而 ， 你 可 以 采取 一 个 递归 的 分 治 策略 ， 这 个 


策略 利用 了 以 下 公式 的 优点 : 


x" mox"ox x" 


使 用 公式 编写 一 个 以 O (log N) 时 间 运 行 的 递归 版 本 的 函数 raiseToPower. 


2. 其 他 一 些 排序 算法 也 具有 选择 排序 的 行为 。 其 中 一 个 最 重要 的 排序 算法 就 是 插入 排序 (inserting 
sort) 算法 ， 这 个 算法 进行 以 下 操作 : 首先 对 矢量 中 的 每 一 个 元 素 依次 进行 检查 ， 就 像 在 选择 排序 算 
法 中 那样 。 然 而 ， 在 这 个 过 程 中 ,你 的 目标 不 是 找 出 矢量 中 剩余 元 素 的 最 小 值 并 将 其 放 入 到 正确 的 
位 置 ， 而 是 确保 到 目前 为 止 所 有 考虑 的 元 素 都 处 在 正确 的 位 置 。 尽 管 这 些 值 可 能 会 随 着 处 理 元 素 的 
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增加 而 移动 ， 但 是 它们 本 身 形成 了 一 个 有 序 的 序列 。 
例如 ， 如 果 你 再 次 考虑 本 章 中 用 来 排序 的 示例 数据 ， 插 入 排序 算法 的 第 一 次 循环 没有 做 任何 工 
作 ， 因 为 只 含有 一 个 元 素 的 矢量 总 是 有 序 的 : 


有 序 


ge ris 
spe Ie TSISTS IS Tw 
0 l 2 3 4 5 6 7 


在 下 一 次 循环 中 ， 你 需要 将 25 放 在 你 已 经 看 见 过 的 元 素 中 的 正确 的 位 置 上 ， 这 也 就 意味 着 你 需要 
交换 56 和 25 的 位 置 以 便 使 矢量 达到 以 下 状态 : 
有 序 


oo 
要 | 全 | 六 | ae | ee | 也] es CI 
0 1 2 3 4 5 6 7 


在 第 三 次 循环 中 ， 你 需要 找 出 37 应 该 放 在 哪里 。 为 此 ， 你 需要 将 前 面 的 元 素 向 后 移动 (你 知道 这 些 
元 素 它们 彼此 是 有 序 的 )， 用 来 寻找 37 这 个 元 素 应 该 所 处 的 正确 位 置 。 随 着 算法 的 进行 ， 你 需要 将 
每 一 个 大 的 元 素 向 右 移动 一 个 位 置 ， 最 终 产 生 了 一 个 欲 插 入 元 素 的 空间 。 此 时 ，56 向 右 移动 一 个 位 
置 ， 同 时 37 向 前 移动 一 个 位 置 。 因 此 ， 经 过 第 三 次 循环 之 后 ， 矢 量 的 状态 如 下 图 所 示 : 

有 序 


Se es 


EJEJEJEJEIEIEIEI 
JEJEJEJEIEIEOES 
每 次 循环 之 后 ， 矢 量 起 始 部 分 总 是 有 序 的 ， 这 也 就 意味 着 用 这 种 方法 循环 通过 的 所 有 位 置 整个 失 量 
都 将 被 排序 。 

插 人 排序 在 实际 中 是 非常 重要 的 ， 因 为 对 于 那些 已 经 或 多 或 少 以 正确 顺序 排序 的 矢量 来 说 ， 它 的 运 
行 时 间 是 线性 的 。 因 此 ， 对 于 那些 只 有 很 少 的 元 素 且 不 是 有 序 的 大 的 矢量 而 言 ， 采 用 插入 排序 对 其 
元 素 进行 重新 排序 是 很 有 意义 的 。 

编写 一 个 使 用 插入 排序 算法 实现 的 sort 函数 。 构 建 一 个 非 正 式 的 参数 来 展示 插 人 排序 最 坏 情况 下 
的 时 间 复 杂 度 是 O (N?) 


. 编写 一 个 函数 ， 跟 踪 sort 函数 处 理 一 个 随机 选择 的 矢量 的 运行 时 间 。 并 使 用 该 函数 编写 一 个 程序 ， 


它 产生 一 个 预先 确定 大 小 的 集合 程序 运行 时 间 的 表格 ， 如 以 下 示例 的 运行 结果 所 示 : 





测量 这 个 排序 程序 运行 的 系统 时 间 的 最 好 方式 是 使 用 ANSI clock 函数 ， 这 个 函数 可 由 接口 ctime 
导出 。 函 数 clock 不 需要 参数 ， 并 且 返 回 计 算 机 处 理 器 用 来 执行 当前 程序 所 花费 的 时 间 总 量 。 度 
量 单位 以 及 clock 函数 运行 结果 的 存储 类 型 都 取决 于 机 器 的 类 型 ， 但 是 你 总 可 以 使 用 下 面 的 表达 
式 将 依赖 于 系统 的 时 钟 单位 转换 成 秒 : 
double(clock()) / CLOCKS PER SEC 


如 果 你 用 变量 start 以 及 finish 分 别 记 录 程 序 起 始 和 结束 时 间 ， 你 可 以 使 用 下 面 的 代码 来 计算 : 


double start = double(clock()) / CLOCKS PER SEC; 
. -执行 一 些 计算 .，. 


io] 


ON 


N 


oo 
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double finish - double(clock()) / CLOCKS PER SEC; 
double elapsed - finish - start; 


遗憾 的 是 ， 因 为 不 能 确保 系统 时 钟 单位 足够 精确 以 至 于 能 够 测量 出 运行 时 间 ， 所 以 计算 一 个 运行 很 
快 的 程序 所 需 的 时 间 需 要 一 些 巧妙 的 方法 。 例如， 如 果 你 使 用 这 种 策略 来 计算 排序 10 个 整数 的 时 
li], BRASH Boia elapsed 值 很 可 能 是 0。 产 生 这 种 现象 的 原因 是 : 大 多 数 机 器 上 的 处 理 
单元 可 以 在 单个 时 钟 周期 范围 内 执行 许多 指令 一 一 几乎 可 以 对 一 个 含有 10 个 元 素 的 矢量 进行 完整 
的 排序 。 由 于 系统 内 部 时 钟 在 此 期 间 可 能 是 相同 的 ， 因 此 start WA finish 记录 的 值 可 能 是 相 
同 的 。 

避 开 这 个 问题 最 好 的 方法 是 在 两 个 对 clock 函数 的 调用 之 间 多 次 重复 这 个 计算 。 例 如 ， 如 果 
你 想 要 确定 排序 10 个 数 需要 花费 多 长 时 间 ， 你 可 以 连续 对 10 个 数 执行 1000 次 排序 ， 然 后 将 总 的 
运行 时 间 除 以 1000。 这 种 策略 提供 了 一 种 更 加 精确 的 计时 方法 。 





. 假设 你 已 经 知道 一 个 整数 数组 中 元 素 值 的 范围 为 0 到 9999。 证 明 编 写 一 个 复杂 度 为 O(N) 的 算法 来 


对 这 个 数组 进行 排序 是 可 能 的 。 实 现 你 的 算法 ， 并 且 通 过 使 用 习题 3 中 概括 的 策略 采取 实际 测量 的 
方式 来 评估 该 算法 的 性 能 。 当 N 取 较 小 值 时 ， 解 释 该 算法 与 选择 排序 算法 相 比 ， 为 什么 缺乏 效率 。 


. 编写 一 个 能 够 产生 比较 两 个 算法 (线性 查找 和 二 分 查找 ) 性 能 的 表格 程序 ， 它 们 都 在 一 个 有 序 的 


Vector<int> 类 对 象 中 随机 地 查找 一 个 整数 关键 字 。 线 性 查找 算法 仅仅 是 依次 地 检查 矢量 中 的 每 
一 个 元 素 以 确定 在 矢量 中 是 否 存在 待 查找 的 关键 字 。 图 7-5 中 的 二 分 查找 算法 应 用 于 元 素 类 型 为 字 
符 串 的 矢量 ， 它 使 用 了 一 种 分 治 策略 ， 通 过 检查 矢量 的 中 间 元 素 ， 然 后 再 决定 在 剩 下 元 素 中 的 哪 一 
部 分 进行 查找 。 

对 这 个 问题 以 表格 形式 产生 两 种 算法 的 性 能 比较 ， 不 像 习 题 3 那样 计算 时 间 ， 而 是 计算 矢量 中 元 素 
比较 的 次 数 。 为 了 确保 结果 不 是 完全 的 随机 ， 你 的 程序 应 该 进行 多 次 独立 的 试验 ， 然 后 再 算出 结果 
的 平均 数 。 程 序 运行 的 一 个 示例 如 下 图 所 示 : 


2.2 
5.4 
6.2 
B.6 
9.2 
12.0 
3.8 
5.6 
6.8 


Lu 





. 修改 快速 排序 算法 的 实现 方法 ， 不 同 于 挑选 矢量 中 的 第 一 个 元 素 作为 基准 ， 划 分 〈partition) 函数 选 


择 第 一 个 元 素 、 中 间 元 素 ， 以 及 最 后 元 素 的 中 位 数 作为 基准 。 


. 对 于 大 的 矢量 来 说 ， 尽 管 时 间 复 杂 度 为 O(N log N) 的 排序 算法 明显 要 比 时 间 复 杂 度 为 的 O(N?) 算 


法 更 加 高 效 ， 当 N 取 较 小 值 时 ， 像 选择 排序 一 样 的 简单 二 次 算法 往往 意味 着 它们 有 更 好 的 性 能 。 这 
一 事实 提出 了 可 开发 一 种 将 两 种 算法 相 结合 的 策略 : 对 于 大 的 矢量 使 用 快速 排序 算法 ,而 当 矢量 中 
元 素数 目 小 于 某 个 被 称 为 分 界 点 〈 crossover point) 的 阔 值 时 ， 使 用 选择 排序 算法 。 将 两 种 不 同 的 算 
法 结合 在 一 起 ， 并 利用 各 自 最 好 的 特性 的 方法 被 称 为 混合 策略 (hybrid strategy). 

采用 综合 快速 排序 算法 和 选择 排序 算法 的 混合 策略 重新 实现 sort 函数 。 对 分 界 点 的 每 一 个 不 同 
的 值 分 别 进行 试验 ， 当 小 于 分 界 点 值 时， 函数 实 现 选 用 选择 排序 ， 并 且 确 定 了 哪些 值 提供 了 最 佳 性 
能 。 分 界 点 的 值 取决 于 你 电脑 特定 的 时 间 特 性 ， 并 且 随 着 系统 的 修改 而 修改 。 


. 对 排序 问题 另 一 个 有 趣 的 混合 策略 是 : 以 一 个 快速 排序 的 递归 实现 开始 ， 当 矢量 的 大 小 低 于 某 个 特 


定 的 贱 值 时 ， 只 简单 地 返回 。 当 该 函数 返回 时 ， 矢 量 并 没有 排序 ,但 是 所 有 的 元 素 都 相对 地 接近 于 
它们 最 终 的 位 置 。 此 时 ， 你 可 以 对 整个 矢量 使 用 习题 2 中 所 呈现 的 插入 排序 算法 来 处 理 剩 下 整个 矢 
量 元 素 以 固定 剩余 的 问题 。 在 矢量 中 的 大 多 数 元 素 已 经 有 序 的 情况 下 ， 插 和 人 排序 的 运行 时 间 是 线性 
的 ， 因 此 以 上 两 步 过 程 比 每 一 个 单独 的 算法 运行 得 都 要 快 。 编 写 一 个 以 这 种 混合 方法 实现 的 sort 
PRL, 
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9. 假设 你 有 两 个 函数 和 8g8， 当 六 取 不 同 的 值 时 ， 都 有 矿 (N 小 于 g (N) EAK O 符号 的 正式 定义 
证 明 : 
15f (N) +6g CN) 
的 时 间 复 杂 度 为 O2(8(N))。 
10. 使 用 大 O 符号 的 形式 化 定义 证 明 N? 的 时 间 复 杂 度 为 O(N”)。 
11. 使 用 数学 归纳 法 证 明 以 下 性 质 对 于 所 有 的 整数 V 都 是 正确 的 。 


a) 1+34+5+74+-++++2N1 = WN 

b ?D24532444...4N = wove Ne 

c) D-2e432-44...* N = (1+42+3+4+: +N) 
d 2042! 42 42 4...*2" = 291-1 


12. 习题 1 说 明了 能 够 在 O (log N) 时 间 内 计算 x"。 这 一 事实 反 过 来 可 以 编写 运行 时 间 为 O(log N) 的 
函数 fib (n) 的 实现 ， 它 比 传统 的 和 迭代 版 本 的 函数 实现 运行 得 要 快 得 多 。 为 此 ， 你 需要 依靠 有 点 
令 人 惊讶 的 事实 : 斐 波 那 契 函数 与 被 称 为 黄金 比例 (golden ratio) 的 值 有 关 ， 黄 金 比 例 自古 希腊 数 
学 时 代 就 闻名 遐 偿 。 黄 金 比 例 通常 被 设计 为 用 特定 的 希腊 字母 phi (9) 表示 ， 并 被 定义 为 其 值 满足 
UFER: 

$-9-1-20 
由 于 这 是 一 个 二 次 等 式 ， 因 此 该 等 式 实 际 上 有 两 个 解 ， 如 果 你 运用 二 次 方程 公式 ， 你 将 会 发 现 这 
两 个 根 为 : 


1+V5 
LS 2 
a 1-y5 
T LE 


在 1718 年 ， 法 国 数 学 家 亚伯拉罕 - Bit + 9338 (Abraham de Moivre) AHL T 58 n WE MARA 
字 可 以 被 表示 成 以 下 近似 形式 : 
g'- 
V5 
此 外 ， 由 于 久 总 是 很 小 ， 所 以 该 公式 可 以 被 简化 为 : 
EL 
V5 





四 舍 五 人 为 最 接近 的 整数 。 

使 用 这 个 公式 以 及 习题 1 中 的 raiseToPower 函数 ， 编 写 一 个 运行 时 间 为 O (log N) 的 函数 
fib(n) 的 实现 。 一 旦 你 实验 验证 了 公式 对 于 斐 波 那 契 数 列 中 的 前 几 项 是 正确 的 ， 使 用 数学 归纳 法 
证 明 公式 : 

g-o 
V5 
实际 上 可 以 计算 斐 波 那 契 数列 的 第 ”项 。 
13. 如 果 你 准备 好 挑战 真正 的 算法 ， 编 写 函数 : 


int findMajorityElement (Vector<int> & vec); 


它 以 一 个 非 负 的 整 型 矢量 为 参数 ， 并 且 返 回 多 数 元 素 ( majority element)， 该 返回 值 被 定义 为 一 个 
绝 大 多 数 元 素 (超过 百 分 之 五 十 ) 出 现 的 位 置 。 如 果 多 数 元 素 不 存在 ， 则 函数 返回 -1 以 表示 这 一 
事实 。 你 编写 的 函数 必须 满足 以 下 条 件 : 

e 运行 时 间 必 须 是 O(N). 
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e 必须 使 用 O (1) 的 额外 空间 。 换 句 话 说， 该 函数 可 能 使 用 个 别 的 临时 变量 ， 但 不 会 为 任何 数组 或 
者 矢量 分 配额 外 的 存储 空间 。 此 外 ， 这 个 条 件 排除 了 递归 的 解决 方案 ， 因 为 存储 栈 帧 所 需 的 空间 
将 会 随 着 递归 深度 的 增加 而 增加 。 

。 不 能 修改 矢量 中 的 任何 值 。 

这 个 问题 的 难点 在 于 想 出 算法 ， 而 不 是 怎样 去 实现 它 。 以 几 个 矢量 例子 做 实验 ， 并 且 看 看 你 是 否 

能 够 想 出 一 个 满足 这 些 条 件 的 高 效 策略 。 

14. 如 果 你 喜欢 前 面 的 问题 ， 这 里 有 一 个 更 为 挑战 的 问题 ， 它 曾经 作为 微软 的 面试 题 。 假 设 你 有 一 个 含 
有 N 个 元 素 的 矢量 ， 并 且 这 个 矢量 中 的 每 一 个 元 素 都 有 一 个 在 1 到 N-1 范围 内 的 值 。 假 设 这 个 矢 (471 
HANAR, MRA N-1 个 可 能 的 值 存 储 在 其 中 。 当 然 ， 这 里 一 定 有 一 个 重复 的 值 ， 但 是 你 知 
道 这 里 有 一 个 数学 家 所 说 的 镶 巢 原理 (pigeonhole principle): 如 果 铝 子 的 数目 比 铝 笼 的 数目 要 多 ， 
那么 某 个 铝 笼 中 的 铝 子 数目 肯定 超过 一 个 。 

在 这 个 问题 中 ， 你 的 任务 就 是 编写 一 个 函数 : 


int findDuplicate (Vector<int> vec); 


它 以 元 素 值 范围 为 1 到 N-1 的 矢量 作为 参数 ， 并 且 返 回 其 中 的 一 个 重复 值 。 这 个 问题 的 难点 在 于 

设计 一 个 算法 以 使 你 的 实现 方法 遵循 先前 习题 中 的 条 件 : 

© 运行 的 时 间 必 须 是 .0 (N)。 

。 必须 使 用 O (1) 额外 的 空间 。 换 句 话说， 该 函数 可 能 使 用 个 别 的 临时 变量 但 是 不 会 为 任何 数组 
或 者 矢量 分 配额 外 的 存储 空间 。 此 外 ， 这 个 条 件 排 除了 递归 的 解决 方案 ， 因 为 存储 栈 帧 所 需 的 
空间 将 会 随 着 递归 深度 的 增加 而 增加 。 

© 不 能 修改 矢量 中 的 任何 值 。 

例如 ， 对 于 这 个 问题 可 以 很 容易 写 出 一 个 运行 二 次 方 时 间 的 解决 方案 ， 如 下 所 示 : 

int findDuplicate(Vector<int> & vec) ( 
for (int i = 0; i < vec.size(); i++) ( 
for (int J = 0; j < i; j++) { 
if (vec[i] == vec[jl) return vec[i]; 
) 
) 
error("Vector has no duplicates"); 


return -1; 


} 
难点 在 于 将 其 优化 成 运行 时 间 为 线性 时 间 的 算法 。 472 


第 11 章 | 


Programming Abstractions in C++ 


指针 和 数组 


奥兰多 迅速 浏览 了 一 遍 ， 然 后 用 右手 食指 点 着 ， 念 出 与 这 件 事 有 密切 关系 的 下 列 事实 。 
— p EEE- RK, (RS) (Orlando), 1928 


本 书 大 多 数 程序 都 借助 于 抽象 数据 类 型 来 表示 复合 对 象 。 实 际 上 ， 这 个 策略 很 明显 是 非 
常 正确 的 。 当 你 采用 面向 对 象 语言 (例如 CH) 来 编写 程序 时 ， 你 应 该 尽 可 能 地 采用 类 库 提 
供 的 抽象 类 型 ， 并 且 尽 可 能 规避 复杂 的 底层 细节 。 同 时 ， 多 了 解 一 下 C++ 是 如 何 表示 数据 
的 也 很 有 帮助 。 有 了 这 方面 的 知识 ， 你 就 能 更 好 地 理解 这 些 抽象 类 型 到 底 是 如 何 工作 的 ， 并 
且 帮 助 你 理解 C++ 语言 的 行为 机 制 。 

写 到 这 里 ， 其 实 有 一 个 引 人 注 目的 原因 促使 你 需要 学 习 C++ 的 内 存 机 制 。 在 第 5 章 ， 
你 已 经 了 解 到 使 用 C++ 中 不 可 思议 的 集合 类 可 以 使 得 编程 更 加 容易 。 在 后 续 的 各 章 中 ， 你 
的 首要 目标 就 是 理解 如 何 高 效 地 实现 这 些 结构 。 在 评估 各 种 不 同 算法 的 效率 时 ， 你 需要 明白 
每 一 种 算法 的 选择 代价 。 如 果 不 深入 了 解 C++ 语言 用 来 实现 这 些 算法 的 底层 结构 (最 值得 注 
意 的 指针 和 数组 )， 那 么 也 无 法 对 代价 进行 评估 。 


11.1 内 存 结构 


在 你 理解 C++ 内 存 模型 的 细节 之 前 ， 需 要 知道 信息 是 如 何 被 存放 在 计算 机 中 的 。 每 一 
台 现 代 计 算 机 都 拥有 一 些 作为 信息 主要 存储 库 的 高 速 内 存 。 在 一 台 典 型 的 机 器 中 ， 由 特殊 的 
集成 电路 芯片 构成 的 内 存 被 称 作 RAM， 它 代表 随机 存 取 存 储 器 ( random-access memory ) o 
RAM 允许 程序 在 任何 时 候 可 以 访问 任意 内 存单 元 。 对 于 大 多 数 程序 员 ， 了 解 RAM 芯片 工 
作 的 技术 细节 并 不 重要 。 重 要 的 是 如 何 组 织 管理 内 存 。 


11.1.1 位 、 字 节 和 字 


在 计算 机 中 ， 所 有 的 数值 (不 管 它 多 么 复杂 ) 都 以 信息 的 基本 单元 的 组 合 进行 存储 ， 信 
息 的 基本 单元 是 位 (bit)。 每 一 个 位 只 能 取 两 种 可 能 的 状态 中 的 一 种 。 如 果 你 把 机 器 中 的 电 
流 想 象 成 小 电灯 的 开关 ， 那 么 就 可 以 把 这 两 个 状态 称 为 开 和 关 。 如 果 你 把 每 一 个 位 想象 成 
一 个 布尔 值 ， 则 可 用 true 和 false 来 表示 。 然 而 ， 因 为 单词 “ bit” 最 初 来 源 于 “ binary 
digit” 的 缩写 ， 所 以 经 常用 0 和 1 来 标记 这 两 种 状态 ，0 和 1 这 两 个 数 就 是 计算 机 运算 中 基 
于 二 进 制 系统 所 使 用 的 数字 。 

由 于 一 个 位 所 能 存储 的 信息 太 少 ， 因 此 ， 用 几 个 位 来 存储 数据 并 不 是 最 合适 的 机 制 。 为 
了 更 易于 将 这 些 传统 类 型 的 信息 存储 为 数字 或 字符 ， 将 单个 的 位 连接 组 合 起 来 组 成 更 大 的 
可 整体 对 待 的 存储 单元 。 这 种 最 小 组 合 单元 称 为 一 个 字 节 (byte)， 它 由 8 个 位 构成 ， 并 且 足 
以 存储 一 个 char 类 型 的 数据 。 在 大 多 数 机 器 中 , 字 节 被 集成 为 更 大 的 称 为 字 (word) 的 结 
构 ， 其 中 ， 一 个 字 通 常 可 以 存储 一 个 int 类 型 的 数据 。 今 天 ， 大 多 数 机 器 要 么 使 用 四 字 节 
的 字 ， 要 么 使 用 更 长 的 八字 节 的 字 (32 位 或 64 fiz). 

对 于 一 台 特 定 的 计算 机 ， 其 可 用 内 存量 可 在 很 大 的 范围 内 变化 。 早 期 的 机 器 只 提供 KB 
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(kilobytes) 级 别 的 内 存 ， 二 十 世纪 八 九 十 年 代 开 始 有 MB (megabytes) 级 别 的 内 存 ， 到 今 
天 大 多 数 机 器 都 具有 GB (gigabytes) 级 别 的 内 存 。 在 大 多 数 自然 科学 学 科 中 ， 前 级 kilo, 
mega 和 giga 分 别 代表 一 千 、 一 百 万 和 十 亿 。 然 而 ， 在 计算 机 世界 中 ， 这 些 基于 10 的 数值 
并 不 适合 于 机 器 的 内 存 结构 表示 。 因 此 ， 按 照 传统 惯例 ， 这 些 前 绥 被 用 来 表示 2 WA AEE 
到 的 与 传统 解释 相近 的 值 。 因 此 ， 在 编程 中 ， 前 缀 kilo, mega 和 giga 分 别 代 表 如 下 意义 : 


kilo (K) = 2% = 1 024 
mega (M) = 2% = 1 048 576 
giga (G) = 2" = 1 073 741 824 


20 世纪 70 年 代 早 期 一 台 64KB 的 计算 机 的 内 存 为 64X1024， 即 65 536 字 节 的 内 存 。 同 样 ， 
一 台 现 代 AGB 机 器 的 内 存 为 4X1037 741 824， 即 4 294 967 296 字 节 的 内 存 。 


11.1.2. 二进制 和 十 六 进 制 表示 


一 台 计 算 机 中 的 每 一 个 字 节 存储 的 数据 的 意义 取决 于 系统 如 何 解释 这 些 单 个 位 中 的 数 。 
根据 计算 机 的 硬件 指令 ， 一 个 特定 的 位 序列 可 以 表示 一 个 整数 、 一 个 字符 ， 或 者 一 个 浮 点 
数 ， 它 们 要 求 具 有 不 同 的 编码 模式 。 无 符号 整数 的 编码 模式 最 简单 。 一 个 无 符号 数 中 的 各 位 
可 用 二 进 制 计数 法 (binary notation) 表示 ， 它 的 合法 取 值 只 有 0 和 1， 正如 计算 机 底层 位 中 
数值 的 真实 表示 形式 一 样 。 二 进 制 表 示 在 结构 上 与 我 们 最 熟悉 的 十 进 制 表 示 类 似 , 但 是 ， 二 
进 制 表示 是 以 2 为 基数 而 不 是 以 10 为 基数 的 。 二 进 制 数 的 最 大 好 处 是 其 值 仅 取决 于 它 在 这 
个 数 中 的 位 置 。 最 右边 的 一 个 位 表示 一 个 单位 字段 ， 其 他 位 置 上 数值 的 大 小 总 是 其 右边 数值 
的 两 倍 。 

例如 ， 让 我 们 考虑 一 个 包含 以 下 位 二 进 制 数 的 字 节 : 

001110101700 
这 个 位 序列 代表 数值 42， 你 可 以 将 每 一 位 的 值 计算 相 加 进行 验证 ， 如 下 图 所 示 : 
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此 图 说 明了 如 何 将 一 个 整数 用 二 进 制 数 表示 出 来 ， 但 是 它 也 帮助 我 们 例证 了 这 样 一 个 
事实 ， 即 用 二 进 制 表示 数 并 不 方便 。 二 进 制 表 示 显 得 很 笨拙 ， 更 多 的 是 因为 它们 往往 很 
长 。 十 进 制 表示 更 直观 而 且 被 熟知 ， 但 是 却 很 难 让 我 们 理解 一 个 数 的 计算 机 底层 位 的 表示 
形式 。 

为 了 在 应 用 程序 中 更 好 地 理解 如 何 将 一 个 数 用 二 进 制 表示 ， 而 不 用 纠结 于 过 长 甚至 跨 页 
的 二 进 制 数 ， 计 算 机 科学 家 往往 采用 十 六 (hexadecimal) (基数 16 ) 进 制 表示 。 十 六 进 制 计 
数 法 用 十 六 个 数 表示 ， 从 0 到 15。 十 进 制 数字 0 到 9 已 经 足以 代表 前 十 个 数字 ， 但 是 传统 
的 算术 并 没有 为 额外 的 其 他 六 个 数字 定义 符号 。 计 算 机 科学 因此 采用 字母 A 到 下 来 表示 它 
们 ， 这 些 字母 分 别 代表 的 数值 如 下 : 
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十 六 进 制 计数 法 之 所 以 如 此 吸引 人 ， 就 在 于 你 可 以 立即 在 十 六 进 制 数 和 二 进 制 数 之 间 进 
行 转换 。 你 所 要 做 的 就 是 把 所 有 的 二 进 制 数 的 四 个 位 数 划 为 一 组 。 例 如 ， 数 42 可 以 如 下 图 
所 示 从 二 进 制 转换 到 十 六 进 制 : 
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前 四 位 代表 数字 2， 后 四 位 代表 数字 10。 这 两 个 数字 按照 十 六 进 制 格式 转化 成 对 应 的 十 六 进 
制 数 得 到 2A。 接 着 你 可 以 以 下 述 方法 通过 数值 的 相 加 来 验证 2A. 的 值 仍 是 42: 


为 了 保证 可 读 性 ， 本 书 大 多 数 的 数据 都 采用 十 进 制 表示 。 如 果 不 能 从 上 下 文中 得 知 数 的 
基数 ， 可 根据 本 书 所 遵循 的 采用 下 标 来 代表 基数 这 一 惯用 策略 来 推导 出 其 基数 。 因 此 ， 对 于 
数 42， 它 的 三 种 最 常见 表示 (十进制 、 二 进 制 和 十 六 进 制 ) 形式 如 下 所 示 : 


42i0 = 00101010, = 2Al6 


一 个 数 无 论 采 用 哪 种 进 制 表 示 ， 关 键 在 于 数值 本 身 不 变 ， 数 的 基数 只 影响 其 表示 形式 。 
42 有 一 个 与 基数 无 关 的 真实 解释 。 这 个 真实 解释 可 能 是 小 学 生 使 用 的 最 简单 的 表示 ， 毕 竟 
也 只 是 书写 数字 的 另 一 种 方式 : 


HT ME HT LAT TL RT. II 


这 一 行 表示 的 就 是 数字 42。 事 实 上 ， 一 个 数字 写成 二 进 制 、 十 进 制 或 者 其 他 进 制 仅仅 是 其 
表示 形式 不 同 ， 与 数字 本 身 无 关 。 


11.1.3 ”表示 其 他 数据 类 型 


在 很 多 方面 ， 现 代 计 算 的 基本 理念 就 是 任何 数值 都 可 以 用 位 的 集合 来 表示 。 例 如 ， 很 容 
易 看 出 如 何 仅 用 一 位 来 表示 一 个 布尔 值 。 你 所 要 做 的 就 是 给 每 一 个 位 的 状态 分 配 两 个 布尔 值 
中 的 一 个 。 一 般 地 ，0 代表 false，1 代表 true。 正 如 最 后 一 节 明 确 展示 的 : 你 可 以 用 一 
连 串 的 位 来 存储 一 个 二 进 制 的 无 符号 数 ， 因 此 ， 八 位 二 进 制 序列 00101010 表示 数字 42。 
采用 八 位 ， 可 以 表示 0 到 2*-1， 即 255 个 数 。16 位 可 以 表示 0 到 2"-1， 即 65 535 个 数 。 
32 位 足以 表示 0 到 2?—1, BI 4 294 967 295 个 数 。 

事实 上 ， 内 存 的 每 个 字 节 可 以 存储 0 到 255 中 的 任何 一 个 数值 ， 这 意味 着 这 个 字 节 足 
以 存储 ASCII 字符。 追溯 到 C++ 的 前 趋 语 言 ， 由 于 历史 的 原因 ，C++ 定义 char 类 型 为 一 
个 字 节 长 度 。 这 个 设计 决策 使 得 C++ 程序 在 处 理 那 些 需要 采用 扩展 的 字符 集 编 码 但 又 要 与 
ASCII 字符 模型 相 兼容 的 语言 时 ， 显 得 更 为 艰难 。 因 此 ，C++ 标准 库 定 义 了 wchar t 类 型 
来 表示 “ 宽 字 符 ” 以 扩展 ASCI 编码 范围 。 然 而 ,介绍 这 些 机 制 已 超出 了 本 书 的 范围 。 

通过 编码 上 一 个 微小 的 改变 就 能 使 带 符号 整数 以 位 序列 进行 存储 。 主 要 因为 这 样 做 简化 
了 硬件 设计 ， 大 多 数 计算 机 使 用 被 称 为 2 进 制 补 码 运算 ( two’s complement arithmetic) 来 表 
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示 带 符号 整数 。 如 果 你 想 用 2 的 补 码 运算 表示 一 个 非 负 数 ， 只 需要 简单 地 使 用 传统 的 二 进 制 
表示 即 可 。 但 是 如 果 想 表示 一 个 负数 ， 就 要 用 2” 减 去 该 负数 的 绝对 值 ，N 表示 所 需 的 位 个 
数 。 例 如 ，32 位 的 -1 的 补 码 表示 就 可 以 以 如 下 减法 运算 求 得 : 


100000000000000000000000000000000 
-00000000000000000000000000000001 
114$1111111131111£11111111111111111 


在 C+t+ 中 ， 浮 点 数 也 可 以 以 固定 长 度 的 位 序列 来 表示 。 尽 管 表示 浮 点 数 的 细节 已 经 超 
出 了 本 书 所 讨论 的 范围 ， 但 是 不 难 想象 硬件 开发 将 会 使 用 一 个 字 的 一 些 位 的 子 集 来 表示 浮 点 
值 ， 用 另 一 些 位 子 集 表 示 该 数 的 指数 。 重 要 的 是 ， 需 要 牢记 每 一 个 数 在 计算 机 内 部 都 是 简单 
地 以 位 的 形式 进行 存储 的 。 

在 C++ 中, 不同 的 数据 类 型 需要 不 同 大 小 的 内 存 。 对 于 基本 类 型 ， 以 下 存储 值 是 很 典 
型 的 (尽管 C++ 标准 为 编译 器 的 编写 者 提供 了 灵活 的 机 制 来 根据 特定 的 硬件 类 型 选择 不 同 的 
大 小 ): 


char 1 字 节 (根据 定义 ) 
bool 1 字 节 
short 2 字 节 
int 4 字 节 
float 4 字 节 
long 8 字 节 
double 8 字 节 


long double 16 字 节 


在 C++ 中 ， 一 个 对 象 的 大 小 往往 是 它 所 包含 的 实例 变量 所 占 存储 空间 大 小 的 总 和 。 例 
如 ， 如 果 你 定义 了 如 第 6 章 所 示 的 Point 类 ， 它 的 私有 部 分 包含 以 下 实例 变量 : 

int x; 

int y; 
上 述 的 每 一 个 实例 变量 都 需要 四 个 字 节 ， 因 此 在 大 多 数 机 器 土 存储 这 个 对 象 的 数据 总 共 需 要 
八 个 字 节 的 内 存 。 然 而 ， 编 译 器 允许 给 一 个 对 象 的 内 部 表示 增加 内 存 空间 ， 这 样 做 允许 编译 
器 产生 更 高 效 的 机 器 码 。 因 此 ，Point 对 象 所 占 内 存 的 大 小 至 少 为 8 字 节 ， 使 之 足以 存储 
变量 x 和 Y， 也 可 能 更 大 一 些 。 

在 一 个 C++ 程序 中 ， 你 可 以 用 sizeof 操作 符 来 求 一 个 变量 在 特定 的 平台 上 会 被 分 配 
多 少 字 节 的 内 存 。sizeof 操作 需要 一 个 操作 数 ， 该 操作 数 要 么 是 一 对 括号 内 的 类 型 名 ， 要 么 
是 一 个 表达 式 。 如 果 操 作 数 是 一 个 类 型 名 ，sizeof 操作 将 返回 该 类 型 所 分 配 的 字 节 数 ， 如 
果 操 作 数 是 一 个 表达 式 ，sizeof 返回 的 是 存储 表达 式 的 值 所 需要 的 字 节 数 。 例 如 ， 表 达 式 


sizeof (int) 


返回 需要 存储 一 个 int 类 型 的 值 所 需 的 字 节 数 。 而 表达 式 


sizeof x 


返回 需要 存储 变量 x 的 字 节 数 。 


11.1.4 内存 地 址 


在 一 个 典型 的 计算 机 内 存 系统 中 ， 每 个 字 节 都 由 一 个 数字 地 址 (address) 所 标识 。 计 算 
机 的 第 一 个 字 节 编 址 为 0， 第 二 个 是 1， 以 此 类 推 ， 直 到 机 器 可 表示 的 最 大 字 节 数 减 1。 例 
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如 ， 一 个 内 存 为 64KB 的 小 型 计算 机 的 内 存 地 址 从 字 节 0 开始 到 字 节 65 535 结束 。 然 而 ， 
这 些 数 都 以 十 进 制 表示 ， 这 并 不 是 大 多 数 程序 员 想 要 的 地 址 。 给 定 地 址 与 硬件 的 内 在 结构 密 
不 可 分 ， 一 般 会 想到 内 存 地 址 如 果 用 上 一 小 节 介 绍 的 十 六 进 制 表示 法 ， 应 该 以 0000 开始 编 
址 到 FFFF 结束 。 然 而 ， 重 要 的 是 需 牢 记 地 址 仅仅 是 一 些 简单 的 数 ， 它 的 基数 仅 决定 这 些 数 
如 何 被 表示 出 来 。 
尽管 地 址 也 可 以 被 表示 成 十 进 制 ， 但 是 本 书 使 用 十 六 进 制 表示 地 址 ， 具 体 原 因 如 下 : 
e 地 址 传统 的 表示 法 就 是 十 六 进 制 ，C++ 的 调试 器 以 及 运行 环境 往往 都 以 此 形式 表示 
地 址 。 
© 采用 sans-serif 字 体 的 十 六 进 制 形式 表示 地 址 ， 能 更 容易 识别 出 一 个 特殊 的 数 代表 
的 是 一 个 地 址 而 不 是 某 些 身份 不 明 的 整数 。 在 本 文中 ， 如 果 你 看 到 数字 65 536， 你 
可 以 假定 它 代表 一 个 整数 。 如 果 你 看 到 数 FFFF， 你 可 以 很 自信 地 确定 它 代表 一 个 
地 址 。 
© 采用 十 六 进 制 表示 法 能 更 容易 看 出 为 什么 会 有 一 些 特殊 的 约束 。 如 果 你 把 它 写成 十 
进 制 数 ， 数 65 535 更 像 是 一 个 随机 数 。 如 果 你 把 同样 的 数 用 十 六 进 制 FFFF 表示 ， 
很 容易 识别 这 个 数 是 能 用 16 位 表示 的 数 的 最 大 值 。 
尽管 内 存 地 址 往往 以 字 节 为 单位 ， 但 大 多 数 计算 机 也 支持 更 大 的 如 字 的 操作 单元 。 在 一 
台 典 型 的 机 器 中 ， 一 个 字 有 四 个 字 节 ， 因 此 可 以 用 四 个 字 节 一 组 来 表示 一 个 字 。 然 而 ， 那 样 
的 话 ， 连 续 的 字 的 地 址 以 四 递增 。 字 节 和 字 编 址 的 区 别 如 图 11-1 所 示 。 


字 节 寻 址 字 寻 址 内 存 布局 

ooo1 oo004| | ' i| | 

oooz os | inen Veiis 
0003 ooc — — 1 — nies sali 
0006 ons| i |: | | 堆 区 用 于 在 第 12 章 
ooo7 or | 所 描述 的 动态 分 配 量 
FFF8 rot] | 

Fro real |) | 

FFFA pres] | | | A 

FFFB mo I 1 | | 

FFFC rr| | | | | A FF AH PR 
FFFD ja NR A RC 数 和 方法 调用 所 产生 
FFFE me 上 上 -| 的 栈 帧 中 的 临时 变量 





图 11-1 C++ 程序 典型 的 内 存 布局 


图 11-1 的 右边 给 出 了 在 一 个 典型 的 C++ 程序 中 如 何 组 织 内 存 的 框架 。 程 序 中 的 指令 
(在 底层 都 是 按 位 存储 的 ) 和 全 局 变量 往往 被 存储 在 静态 区 (static area)， 该 区 域 位 于 地 址 编 
址 号 较 小 的 接近 机 器 地 址 空间 的 开始 处 。 该 区 域 所 分 配 的 内 存量 在 程序 运行 期 间 不 会 发 生 
改变 。 
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内 存 中 的 最 高 地 址 区 表示 栈 区 (stack area)。 当 你 的 程序 每 调用 一 个 函数 或 者 方法 ， 计 
算 机 都 会 在 这 个 内 存 区 创建 一 个 新 的 栈 帧 。 当 函数 返回 时 ， 所 创建 的 栈 帧 会 被 撤销 ， 以 为 后 
续 的 函数 调用 所 需 的 栈 帧 释放 内 存 。 下 节 将 对 栈 帧 的 结构 进行 更 为 详细 的 描述 。 

处 于 栈 区 和 静态 区 之 间 的 内 存 区 域 被 称 为 堆 区 (heap area)。 该 区 域 会 在 程序 运行 时 请 
求 更 多 内 存 的 时 候 发 挥 作用 。 该 技术 在 抽象 数据 类 型 的 设计 以 及 实现 中 是 非常 重要 的 ， 具体 
描述 请 见 第 12 章 的 内 容 。 


11.1.5 ”为 变量 分 配 内 存 


当 你 在 一 个 C++ 程序 中 声明 一 个 变量 时 ， 编 译 器 必须 保证 给 声明 的 变量 分 配 足 够 的 内 
存 来 存储 该 类 型 变量 的 值 。 所 分 配 的 内 存 大 小 取决 于 变量 是 如 何 被 声明 的 。 本 书 唯一 用 到 的 
一 种 全 局 变量 是 常量 ( 它 一 般 都 被 分 配 在 内 存 中 的 同一 区 域 )， 该 区 域 在 今天 大 多 数 机 器 架 
构 下 处 于 地 址 相对 较 小 的 内 存 区 。 因 此 ， 如 果 编 译 器 看 到 以 下 声明 : 


const double PI = 3.14159; 


则 编译 器 会 在 低地 址 区 域 分 配 八 个 字 节 内 存 ， 并 将 3.141 59 存储 到 常量 PI 中 。 作 为 一 名 程序 
员 ， 你 不 知道 编译 器 会 选择 什么 内 存 地 址 ， 但 是 如 果 你 构造 一 个 地 址 并 以 图 示 之 ， 它 会 帮助 
你 显现 机 器 内 部 发 生 了 什么 。 这 里 给 出 一 个 示例 ， 你 可 以 想象 常量 PI 被 存储 在 地 址 0200 


中 ， 如 下 图 所 示 : 


然而 ， 大 多 数 变 量 都 是 局 部 变量 。 局 部 变量 被 分 配 在 内 存 高 端 处 的 称 之 为 栈 帧 〈stack 
frame) 连续 的 地 址 块 中 。 从 第 2 章 开 始 你 已 经 了 解 了 栈 帧 ， 但 这 些 框架 当时 被 抽象 描述 为 
盒子 。 在 底层 ， 这 些 变量 被 分 配 一 块 内 存 空间 ， 并 在 每 次 函数 调用 时 被 压 人 栈 项。 

为 了 使 这 个 表述 更 为 具体 ， 让 我 们 追溯 第 1 章 中 的 程序 PowersofTwo 的 运行 过 程 来 
看 一 下 栈 中 到 底 发 生 了 什么 。 这 样 你 也 不 用 一 直 回 淹 前 面 的 图 了 (忽略 程序 中 的 注释 和 函数 
原型 声明 行 )， 该 程序 的 代码 再 次 输出 ， 如 图 11-2 所 示 。 

当 你 运行 程序 PowersofTwo 时 ， 操 作 系统 首先 会 产生 一 个 向 main 函数 的 调用 。 该 
main RARAS, BAPAE, limit 和 i。 因 此， 栈 帧 必须 为 这 两 个 整 型 局 部 
变量 分 配 内 存 ， 如 下 图 所 示 : 





在 该 图 中 ， 变 量 Limit 被 分 配 到 地 址 FFF4， 变 量 i 被 分 配 到 地 址 FFF8。 这 些 地 址 都 是 随 
机 分 配 的 ， 因 此 不 可 能 准确 预测 编译 器 将 会 分 配 哪些 地 址 或 者 先 给 哪个 变量 分 配 内 存 。 你 能 
指望 的 就 是 这 些 变量 都 会 被 分 配 到 指定 为 栈 帧 的 区 域 。 图 中 底部 灰色 的 矩形 表明 计算 机 需要 
追踪 除了 每 一 个 局 部 变量 之 外 的 函数 调用 的 附加 信息 。 如 果 没 有 什么 信息 可 追踪 ， 每 一 个 栈 
帧 也 需要 追踪 程序 返回 的 位 置 。 信 息 的 格式 取决 于 机 器 的 结构 ， 而 且 对 于 理解 数据 模型 并 不 
是 至 关 重 要 的 。 本 书 的 栈 图 在 每 一 个 栈 帧 中 都 包含 一 个 灰色 的 矩形 来 提醒 你 额外 的 信息 是 存 
在 的 ， 并 且 可 视 化 地 理解 每 个 栈 帧 的 扩展 会 更 容易 。 
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/* 
* Pile: PowersOfTwo.cpp 
* 


* This figure contains only the function definitions from the 
* PowersOfTwo program from Chapter 1. 
ae 


int main() { 
int limit; 
cout << "This program lists powers of two." << endl; 
cout << "Enter exponent limit: "; 
cin >> limit; 
for (int i = 0; i <= limit; i++) { 
cout << "2 to the " << i << "=" 
<< raiseToPower(2, i) << endl; 


return 0; 


) 


int raiseToPower(int n, int k) ( 
int result - 1; 
for (int i = 0; i < k; itt) ( 
result *= n; 
} 
return result; 


} 





图 11-2 PowersOfTwo 程序 代码 


当 该 程序 运行 时 ， 每 个 函数 都 访问 它 自己 的 栈 帧 ， 并 且 在 栈 帧 变化 时 更 新 局 部 变量 的 
值 。 假 设 用 户 输入 8 作为 limit 的 值 ， 那 么 在 第 一 次 调用 raiseToPower 之 前 的 那 一 刻 ， 
其 栈 帧 中 的 内 容 如 下 图 所 示 : 





形 参 变 量 n 和 k 的 值 ， 以 及 局 部 变量 result 和 i。 形 参 变量 被 初始 化 为 实 参 的 值 ， 这 意 
了 味 着 现在 的 栈 如 下 图 所 示 : 





MORE raiseToPower 返回 时 ， 它 的 栈 帧 会 被 撤销 ， 返 回 到 它 被 调用 之 前 的 状态 。 

这 个 例子 很 简单 ， 而 且 没有 涉及 创建 更 多 精确 内 存 图 的 复杂 度 问题 。 然 而 ， 这 个 例子 确 
实 足 以 使 你 掌握 了 为 理解 将 在 下 节 介 绍 的 指针 主题 中 所 涉及 的 如 何 为 变量 分 配 内 存 所 需 的 基 
本 知识 。 在 第 12 章 ， 你 将 有 机 会 返回 到 内 存 图 ， 并 且 学 到 更 多 有 关内 存 分 配 的 策略 。 


11.2 ”指针 
C++ 的 一 个 设计 原则 是 : 程序 员 应 该 尽 可 能 多 地 访问 到 由 底层 硬件 提供 的 机 制 。 因 此 ， 
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C++ 语言 使 得 内 存 位 置 的 地 址 对 程序 员 可 见 。 一 个 数据 项 的 值 是 内 存 中 的 一 个 地 址 ， 该 数 
据 项 被 称 为 一 个 指针 ( pointer)。 在 许多 高 级 编程 语言 中 ， 指 针 用 得 很 保守 ， 因 为 这 些 语 言 
提供 了 其 他 机 制 来 限制 对 于 指针 的 需求 。 例 如 ，Java 编程 语言 对 程序 员 隐 藏 了 所 有 指针 。 
在 C++ 中 ， 指 针 使 用 得 很 普遍 ， 而 且 如 果 不 了 解 指针 如 何 工作 就 不 可 能 理解 大 多 数 专业 的 
C++ 程序 。 

在 C++ 中 ， 指 针 有 很 多 用 途 ， 下 面 几 条 是 其 中 最 重要 的 : 
指针 允许 以 一 种 压缩 的 方式 引用 一 个 大 的 数据 结构 。 一 个 程序 中 的 数据 结构 可 以 变 
ERK. AM, 无论 它 多 大 ， 数 据 结构 始终 会 在 计算 机 内 存 中 占有 一 席 之 地 ， 并 
因此 获得 一 个 地 址 。 指 针 允 许 你 使 用 这 个 地 址 作为 那个 数据 结构 所 表示 的 值 的 一 个 
缩写 。 由 于 一 个 内 存 地 址 一 般 占 用 四 个 字 节 的 存储 空间 ， 因 此 ， 数 据 结构 本 身 很 大 
时 ， 这 个 策略 节省 了 相当 多 的 内 存 空间 。 
指针 使 得 在 程序 运行 时 能 够 预订 新 的 内 存 。 到 目前 为 止 ， 程 序 中 唯一 能 用 的 内 存 是 
分 配给 你 明确 声明 的 变量 的 内 存 。 在 许多 应 用 程序 中 ， 程 序 运行 时 能 请 求 新 的 内 存 
以 及 用 指针 指向 这 些 内 存 都 是 很 方便 的 。 这 个 策略 将 会 在 12.1 节 中 讨论 。 
指针 可 以 用 来 记录 数据 项 之 间 的 关系 。 在 高 级 的 程序 应 用 中 ， 指 针 被 广泛 地 用 于 建 
模 单 个 数据 值 之 间 的 关联 。 例 如 ， 程 序 员 通 常 通过 在 第 一 个 数据 项 的 内 部 表示 中 用 
一 个 指针 指向 第 二 个 数据 项 来 指明 一 个 数据 项 跟随 另外 一 个 的 概念 顺序 。 使 用 指针 
来 创建 各 个 组 件 之 间 联 系 的 数据 结构 被 称 为 链接 结构 (linked structure)。 链 接 结 构 
在 实现 许多 抽象 数据 类 型 时 扮演 着 重要 角色 ， 你 会 在 本 书 的 后 半 部 分 遇 到 这 些 抽 象 
数据 类 型 。 


11.2.1 把 地 址 当 作 数 值 


在 C++ 语言 中 ,任何 引 用 内 存 中 能 够 存储 数据 的 内 存单 元 的 表达 式 被 称 为 左 值 
(lvalue)。 之 所 以 被 称 为 左 值 ， 是 因为 这 些 标 识 符 都 出 现在 C++ 赋值 语句 的 左边 。 例 如 ， 简 
单 的 变量 就 是 一 个 左 值 ， 因 为 你 可 以 编写 如 下 这 条 语句 : 


x = 1.0; 


然而 C++ 中 的 许多 值 都 不 是 左 值 。 例 如 常量 就 不 是 左 值 ， 因 为 常量 不 能 被 改变 。 同 样 ， 
尽管 数学 表达 式 的 结果 是 一 个 值 ， 但 它 也 不 是 左 值 ， 因 为 不 能 给 一 个 表达 式 的 结果 赋 一 个 
新 值 。 

下 面 是 C++ 中 左 值 的 一 些 属 性 : 

e 任何 一 个 左 值 都 存储 在 内 存 中 ， 所 以 都 有 一 个 地 址 。 

e 一 旦 声明 了 一 个 左 值 ， 它 的 地 址 将 不 会 改变 ， 尽 管 地 址 中 存储 的 内 容 会 发 生 改 变 。 

e 一 个 左 值 的 地 址 是 一 个 指针 值 ， 它 可 以 被 存储 在 内 存 中 ， 并 且 可 以 和 数据 一 样 被 

操作 。 


11.2.2 ”声明 指针 变量 


就 像 C++ 中 的 其 他 变量 一 样 ， 在 使 用 指针 变量 之 前 对 它 必 须 进 行 声明 。 为 了 声明 一 个 
变量 为 指针 变量 ， 你 所 需要 做 的 就 是 在 声明 的 变量 名 前 加 一 个 星 号 (*) 即 可 。 例 如 ， 下 行 
代码 : 
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int *p; 
声明 p 是 一 个 指向 int 型 的 指针 变量 。 类 似 地 ， 下 行 代码 : 


char *cptr; 


声明 cptr 为 指向 char 类 型 变量 的 指针 。 这 两 种 类 型 (指向 int 类 型 的 指针 和 指向 char 
类 型 的 指针 ) 在 C++ 中 是 不 同 的 ， 尽 管 它们 在 内 部 都 表示 为 地 址 。 为 了 使 用 指针 地 址 中 的 数 
据 ， 编 译 右 需要 知道 如 何 解 释 它 ， 因 此 要 求 必须 明确 地 指明 指针 所 指 对 象 的 类 型 。 指 针 所 指 
对 象 的 类 型 被 称 为 指针 的 基 类 型 ( base type)。 因 此 ， 指 向 int 的 指针 类 型 是 以 int 作为 其 
基 类 型 的 。 

值得 注意 的 是 ， 星 号 用 来 指明 一 个 变量 是 一 个 指针 变量 ， 在 语法 上 它 属 于 变量 名 , 但 具 
有 基 类 型 。 因 此 ， 当 你 在 同一 个 声明 语句 中 声明 两 个 指向 相同 类 型 的 指针 时 ， 需 要 给 每 个 变 
量 标记 一 个 星 号 ， 如 下 所 示 : 

int *p1, *p2; 
而 以 下 声明 : 

int *pl, p2; 


则 声明 pl 为 指向 一 个 整数 的 指针 ， 而 p2 被 声明 为 一 个 整 型 变量 。 


11.243 ”基本 的 指针 运算 
C++ 定义 了 两 个 操作 符 ， 人 允许 你 在 指针 和 目标 数据 之 间 进 行 运算 : 
& 取 地 址 
* 取 指 针 所 指 对 象 的 值 
& 操作 符 取 一 个 左 值 作为 操作 数 ， 返 回 左 值 所 在 的 内 存 地 址 。* 操作 符 可 以 是 任何 类 型 的 指 
针 变 量 ， 并 返回 指针 变量 所 指 对 象 的 左 值 。 这 种 运算 被 称 作 解析 引用 ( dereferencing)。* 操 
作 返 回 一 个 左 值 ， 这 意味 着 可 以 给 解析 引用 的 指针 赋值 。 
说 明 这 些 操作 符 最 简单 的 方式 是 举例 说 明 ， 考 虑 如 下 声明 : 
ik M Api 
这 些 声明 语句 共 分 配 了 四 个 字 的 内 存 ， 两 个 是 int 类 型 ， 两 个 是 指向 int 类 型 的 指针 类 
型 。 具 体 而 言 ， 让 我 们 假设 下 面 这 些 值 存储 在 栈 中 ， 其 机 内 地 址 如 下 图 所 示 : 
FFo0 
FF04 


FF08 p1 
FFoC p2 


给 出 这 些 声明 ， 你 就 可 以 像 以 往 一 样 使 用 赋值 语句 为 x 和 y 赋值 。 例 如 ， 执 行 下 面 的 
赋值 语句 : 


x = 42; 
y = 163; 


得 到 以 下 内 存 状 态 : 
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为 了 初始 化 指针 变量 pl 和 gp2， 你 需要 用 代表 某 个 整 型 对 象 地 址 的 值 赋 给 p1 或 p2。 
在 C++ 语言 中 ,产生 地 址 的 操作 符 是 &， 你 可 以 利用 赋值 和 & 操作 符 使 pl 指向 y，p2 指 
向 X: 


pl = &y; 
p2 = &x; 
这 些 赋值 语句 执行 之 后 内 存 状 态 如 下 图 所 示 : 


pl 的 值 为 FEF04， 它 是 变量 y 的 地 址 。 类 似 地 ，p2 的 值 为 FF00， 它 是 变量 x 的 地 址 。 

使 用 明确 的 地 址 来 表示 指针 强调 了 这 一 事实 : 地 址 在 内 部 以 数字 进行 存储 。 然 而 ， 它 并 
没有 使 你 直观 地 认识 到 指针 的 意义 。 为 了 实现 这 一 目标 ， 最 好 使 用 箭头 来 表明 每 个 指针 的 所 
指 对 象 。 如 果 你 除去 了 整个 地 址 值 ， 并 且 用 箭头 表示 指针 ， 则 如 下 图 所 示 : 


图 中 使 用 箭头 使 我 们 很 明显 地 看 出 变量 pl Al p2 指向 了 其 箭头 所 指 单元 。 箭 头 使 得 更 容易 
理解 指针 是 如 何 工 作 的 ， 因 此 在 本 书 中 大 多 数 都 使 用 内 存 图 来 表示 指针 。 同 时 ， 要 牢记 指针 
只 是 简单 的 数字 地 址 ， 它 在 机 器 内 部 没有 箭头 。 

为 了 从 指针 中 取出 它 所 指 的 对 象 值 ， 可 以 使 用 * 操作 符 。 例 如 ， 以 下 表达 式 : 


*pl 


表明 取出 pl 所 指 的 内 存单 元 的 数据 。 而 且 ， 由 于 pl 声明 指针 为 一 个 整数 ， 所 以 编译 器 
知道 *pl 表达 式 必 然 指 向 一 个 整数 类 型 的 对 象 。 因 此 ， 假 设 内 存 中 布局 和 图 示 一 样 ， 那 么 
*pl 就 是 变量 y 的 一 个 别名 。 

就 像 简 单 变量 y 一 样 ， 表 达 式 *p1 也 是 一 个 左 值 ， 可 以 给 它 赋值 。 执 行 以 下 的 赋值 
语句 : 


*pl = 17; 
会 改变 变量 y 的 值 ， 因 为 指针 变量 pl 指向 Y。 这 个 赋值 操作 执行 后 ， 内 存 格局 如 下 : 
[2 p 
[ Ww Y 
p m. 


poc» — jw 
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可 以 看 出 ， 变 量 pl 的 值 本 身 没 有 因为 赋值 语句 而 改变 ，P1 始终 指向 变量 yo 
还 可 以 给 指针 变量 自身 赋 新 值 。 例 如 ， 语 句 


pl = p2; 
告诉 计算 机 把 变量 p2 的 值 复制 到 变量 pi 中 。 变 量 p2 中 的 值 是 一 个 指针 值 FF00。 如 果 把 
该 值 复制 到 变量 pl 中， 那么 两 个 指针 变量 的 值 就 相同 ， 如 下 图 所 示 : 


只 要 你 牢记 指针 的 底层 表示 是 一 个 整数 ， 那 么 复制 指针 值 就 一 点 也 不 显得 神秘 了 ， 它 仅 
将 指针 值 复 制 到 目的 地 。 如 果 你 用 箭头 画 出 内 存 图 ， 必 须 牢记 复制 一 个 指针 代替 目标 指针 ， 
只 需要 用 一 个 新 的 箭头 和 原来 的 指针 指向 相同 的 位 置 。 因 此 ， 以 下 赋值 语句 


pl = p2; 


的 效果 就 是 改变 从 p1 引出 的 箭头 ， 以 使 它 也 指向 来 自 p2 的 箭头 所 指向 的 相同 的 内 存 地 址 ， 
如 下 图 所 示 : 


=} 
[^ 
— 
=" 
区 分 指针 赋值 和 数值 赋值 很 重要 ， 指 针 赋 值 (pointer assignment), 4n 
pl = p2; 
使 得 pl All p2 指向 相同 的 地 址 。 相 反 地 ， 数 值 赋值 (value assignment)， 如 以 下 语句 : 
*pl = *p2; 


是 将 p2 所 指向 的 地 址 中 的 数据 复制 到 pl 所 指向 的 地 址 中 。 


11.2.4 ”指向 结构 和 对 象 的 指针 

上 节 中 的 例子 仅 声 明了 指向 一 些 基 本 类 型 的 指针 。 在 C++ 中 ， 对 结构 体 和 对 象 使 用 指 
针 是 很 常见 的 事 。 例 如 ， 下 列 声明 : 

Point pt(3, 4); 

Point *pp = &pt; 
声明 了 两 个 局 部 变量 。 变 量 pt 是 一 个 带 有 坐标 值 3 和 4 的 Point 类 型 对 象 。 变 量 pp 指向 
pt。 使 用 基于 指针 的 格式 ， 得 到 的 内 存 图 如 下 图 所 示 : 





基于 指针 pp， 你 可 以 使 用 * 操作 符 得 到 它 所 指 对 象 的 内 容 ， 因 此 ，*pp 和 pt 的 效果 相同 。 
然而 ， 如 果 你 将 一 个 指针 指向 一 个 对 象 ， 并 且 需 要 索引 到 该 对 象 的 区 域 和 方法 时 ， 你 确 
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实 需要 磨炼 一 些 细心 。 例 如 ， 你 不 能 用 指针 进行 如 下 调用 : 


*PP.getX() 党 


尽管 代码 看 起 来 没有 问题 ， 但 这 个 表达 式 中 有 一 个 优先 级 问题 。 在 C++ 语言 中 ， 点 操作 符 
的 优先 级 比 星 操 作 符 高 ， 这 就 意味 着 编译 器 想 要 如 下 所 示 解 释 该 表达 式 


* (pp. getx()) 


这 显然 没有 意义 。 你 想 让 它 做 的 是 先 将 指针 解析 ， 然 后 再 调用 方法 ， 这 就 意味 着 表达 式 应 该 
加 上 如 下 所 示 的 括号 : 


(*pp) .getx() 


该 表达 式 得 到 了 预期 值 ， 但 每 天 这 样 使 用 会 显得 非常 烦琐 。 当 你 编写 一 些 更 复杂 的 应 用 时 ， 
会 发 现 自己 总 是 在 使 用 指向 对 象 的 指针 。 和 迫使 程序 员 在 每 一 次 操作 时 加 上 这 些 括号 会 使 得 指 
针 指向 对 象 相当 不 方便 。 为 了 消除 这 种 不 便 ，C++ 语言 定义 了 操作 符 ->， 它 是 由 解析 与 选 
择 操作 符 组 合 而 形成 的 一 个 单一 的 操作 符 。 因 此 ， 采 用 指针 pp 来 调用 getx 方法 的 惯用 语 
法 为 : 


Pp->getx () 


11.2.5 ”关键 字 this 


当 你 实现 一 个 类 时 ，C++ 语言 定义 关键 字 tnis 作为 指向 当前 对 象 的 指针 。 这 种 定义 有 
铸 干 重要 的 应 用 ， 你 将 会 在 后 面 的 示例 中 发 现 。 其 中 ， 最 常见 的 一 种 就 是 你 可 以 使 用 关键 字 
this 来 选择 一 个 对 象 的 实例 变量 ， 尽 管 它们 的 名 字 都 被 形 参 变量 或 者 局 部 变量 隐藏 了 。 

隐藏 问题 在 第 6 章 讲 Point 类 的 构造 函数 时 曾 介 绍 过 ， 当 时 的 构造 函数 是 这 样 的 : 

Point(int cx, int cy) ( 

y = cy; 

) 
该 构造 函数 的 参数 必须 命名 为 除 x 和 y 之 外 的 其 他 名 称 ， 以 避免 与 实例 变量 产生 命名 冲突 。 
然而 ， 用 户 很 可 能 党 得 新 命名 有 一 点 难 懂 。 从 用 户 的 角度 看 ，x 和 y 才 是 构造 函数 最 恰当 的 
命名 。 但 是 从 实现 者 的 角度 来 看 ，x 和 y 却 是 实例 变量 的 完美 命名 。 

只 有 使 用 关键 字 this 来 选择 实例 变量 才能 使 用 户 和 实现 者 同时 满意 ， 如 下 所 示 : 


Point(int x, int y) ( 
this->x = x; 
this->y = y; 
} 
一 些 程序 员 建 议 : 使 用 this 引用 当前 对 象 的 成 员 使 得 代码 更 易于 阅读 。JavaScript 语言 到 
目前 为 止 对 于 所 有 的 引用 均 使 用 关键 字 this。 然 而 本 书 遵循 C++ 语言 传统 ， 只 会 在 解决 二 
义 性 的 时 候 使 用 this。 


11.2.6 ”特殊 的 指针 NULL 
在 许多 指针 应 用 中 ， 有 一 个 特殊 指针 ， 它 并 不 指向 任何 实际 内 存 地 址 ， 至 少 目前 不 指 
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向 。 这 个 特殊 的 值 被 称 作 空 指针 (null pointer)， 并 且 在 内 部 表示 为 地 址 值 0。 在 C++ 语言 
中 ， 表 示 一 个 空 指针 最 好 的 方式 就 是 使 用 常量 NULL ， 该 常量 已 在 <cstddef> 接口 中 定义 。 

用 * 操作 符 取 一 个 空 指针 是 不 合法 的 。 今 天 使 用 的 很 多 流行 的 编程 环境 一 般 都 会 识别 出 
该 错误 并 中 止 程序 的 运行 , 但 是 这 种 情况 不 是 总 会 发 生 。 在 一 些 机 器 中 试图 读 取 一 个 空 指针 
所 指向 的 目标 数值 时 ， 会 返回 存储 在 地 址 0000 中 的 数据 。 这 种 情况 也 适用 于 未 初始 化 的 指 
针 。 如 果 你 声明 但 未 初始 化 的 一 个 指针 变量 ,计算 机 会 把 指针 的 数据 解析 为 一 个 地 址 值 ， 并 
且 尝 试 读 取 那 块 内 存 空间 的 数值 。 此 时 ， 程 序 就 非常 容易 崩 演 。 

空 指 针 的 使 用 会 在 本 书 的 具体 应 用 中 介绍 ， 现 在 只 需 知道 存在 这 个 常量 即 可 。 


11.2.7 ”指针 和 引用 调用 


C++ 内 部 通过 使 用 指针 来 实现 引用 调用 。 当 一 个 参数 通过 引用 传递 时 ， 栈 帧 会 在 调用 时 
存储 一 个 指针 指向 该 值 的 内 存单 元 。 该 值 的 任何 改变 都 会 影响 指针 的 目标 数据 ， 这 也 意味 着 
这 些 改变 直到 函数 返回 一 直 有 效 。 

图 11-3 的 程序 提供 了 一 个 简单 的 示例 来 阐明 C++ 如 何 实现 引用 调用 。 程 序 从 用 户 端 读 
取 两 个 整数 并 且 验 证 它们 是 否 依照 递增 顺序 排序 。 如 果 没 有 ， 程 序 会 调用 函数 swap 来 交换 
它们 的 值 。 

假设 你 运行 了 这 个 程序 ， 并 且 输 入 了 20 和 10， 如 下 图 所 示 : 


3 d MODA s 





Enter nl: 20 
Enter n2: 10 - 





" w AO 


这 两 个 值 没有 递增 排序 ， 所 以 主 函 数 将 会 调用 swap。 调 用 之 前 栈 中 的 数据 表示 如 下 : 


函数 swap 取 引 用 作 参 数 ， 这 就 意味 着 swap 的 栈 帧 给 出 的 是 地 址 值 而 不 是 数值 。 调 用 
之 后 ， 栈 中 的 数据 如 下 : 





swap 的 所 有 指向 x RI y 的 引用 被 传递 给 变量 nl 和 n2 ， 作 为 指针 的 目标 数据 。 交 换 这 两 个 
值 意味 着 在 swap 调用 返回 之 后 函数 产生 的 效果 还 在 延续 ， 如 下 图 所 示 : 
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This program illustrates the use of call by reference to exchange 
the values of two integers. 


#include <iostream> 
#include "simpio.h" 
using namespace std; 


/* Function prototype */ 
void swap(int & x, int & y); 
/* Main program */ 


int main() ( 
int nl = getInteger("Enter nl: "); 
int n2 = getInteger("Enter n2: "); 
if (nl » n2) swap(nl, n2); 
cout << "The range is " << nl << " to " << n2 << "." << endl; 
return 0; 


Function: swap 
Usage: swap(x, 


Exchanges the values of x and y. The arguments are passed by 
reference and can therefore be modified. 


x7 


void swap(int & x, int & y) { 
int tmp = x; 
x = y; 

) y = tmp; 





图 11-3 ”确保 两 个 整数 是 顺序 的 程序 
程序 会 继续 使 用 更 新 了 的 数据 ， 这 就 得 到 了 下 面 的 输出 : 





|The range is 10 to 20. 





[on 
A 
* 
A 
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尽管 引用 调用 十 分 方便 ， 但 这 并 不 是 C++ 语言 一 个 至 关 重 要 的 特性 。 你 可 以 通过 
明确 地 调用 指针 来 替代 引用 调用 的 效果 。 在 该 程序 中 ， 你 所 要 做 的 就 是 改变 swap 的 实现 
如 下 : 
void swap(int *px, int *py) ( 
int tmp = *px; 
“px = *py: 
*py = tmp; 
} 


在 主 程序 中 的 调用 变 为 : 
swap(&nl, &n2); 


在 习题 中 ， 你 会 有 机 会 练习 将 使 用 引用 调用 的 程序 转换 成 基于 指针 的 等 价 程序 。 
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11.3 ”数组 


当 Vector 类 在 第 5 章 第 一 次 出 现时 ， 那 一 小 节 介 绍 了 矢量 和 数组 ， 注 意 你 很 可 能 已 
经 从 前 面 的 编程 经 验 中 有 了 一 些 数组 的 概念 。C++ 语言 提供 了 一 个 内 置 的 数组 类 型 ， 它 基于 
A C 语言 继承 而 来 的 语言 模型 。 尽 管 在 很 多 应 用 程序 中 还 是 能 看 到 数组 ， 但 考虑 到 已 有 的 
Vecotr 集合 类 更 加 灵活 方便 ， 所 以 在 新 的 代码 中 没什么 理由 再 使 用 数组 了 。 
在 C++ 语言 中 ， 数 组 (array) 是 一 个 较 低 级 的 多 个 数据 值 的 集合 ， 它 具有 以 下 两 个 显著 
特性 : 
1. 数组 是 有 序 的 。 你 肯定 能 够 按照 数组 元 素 的 索引 值 依次 地 读 写 它们 : 第 一 个 、 第 二 
个 ， 以 此 类 推 。 
2. 数组 是 同 质 的 。 数 组 中 的 每 个 元 素 值 必须 是 同类 型 的 。 因 此 ， 你 可 以 定义 一 个 整 型 
数组 或 一 个 浮 点 型 数组 ， 但 是 数组 不 允许 两 种 类 型 的 元 素 混合 存在 。 
既然 你 已 经 熟悉 了 矢量 类 ， 很 容易 想到 将 数组 作为 实现 矢量 想法 的 原始 实现 。 正 如 矢量 一 
样 ， 数 组 包含 一 些 由 整 型 索引 选择 的 基 类 型 的 单个 元 素 。 画 出 一 个 表示 矢量 的 图 同样 也 适用 
于 数组 。 虽 然 语义 上 有 些 不 同 ， 但 却 易于 掌握 。 真 正 的 不 同 在 于 数组 的 以 下 约束 使 得 在 实际 
应 用 中 矢量 显得 更 好 用 : 
© 数组 被 分 配 为 固定 大 小 的 内 存 ， 之 后 不 能 再 改变 。 
e 尽管 数组 有 固定 大 小 内 存 ，C++ 语言 并 没有 使 得 其 容量 对 程序 员 可 用 。 结 果 是 处 理 
数组 的 程序 需要 一 个 额外 的 变量 来 追踪 元 素 的 个 数 。 
© 数组 不 支持 插入 和 删除 元 素 。 
e. C++ 没有 提供 边界 检查 来 确保 你 选择 的 元 素 存在 于 数组 中 。 
尽管 有 这 些 明显 的 缺点 ， 数 组 仍然 可 以 在 其 上 建立 更 有 威力 的 集合 类 的 框架 。 为 了 理解 
这 些 类 的 实现 ， 你 需要 熟悉 数组 的 实现 机 制 。 


11.3.1 声明 数组 
就 像 C++ 语言 中 的 其 他 变量 一 样 ， 数 组 在 使 用 之 前 必须 声明 。 声 明 数 组 的 一 般 形式 为 : 
type name [size] ; 


HF, type 表示 数组 中 元 素 的 类 型 ，name 是 数组 的 名 称 ，size 是 一 个 表示 数组 元 素 个 数 
的 常量 。 例 如 以 下 声明 : 

int intArray[10]; 
声明 了 一 个 其 元 素 类 型 为 整 型 ， 名 为 intarray 的 数组 ， 它 包含 了 10 个 元 素 。 然 而 ,在 多 
数 情况 下 ， 你 应 该 使 用 符号 常量 而 不 是 确定 的 整数 值 来 指定 数组 的 大 小 ， 这 样 可 方便 地 对 数 
组 大 小 进行 修改 。 因 此 ， 可 以 用 一 个 更 加 传统 的 方法 声明 : 

const int N ELEMENTS = 10; 

int intArray[N ELEMENTS]; 
你 可 以 用 图 示 化 的 方法 来 表示 这 个 表明 : 


intArray 


0 1 2 3 4 5 6 7 8 9 
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和 一 个 矢量 中 的 元 素 一 样 ， 一 个 数组 的 索引 值 从 0 开始 到 数组 容量 减 一 为 止 。 因 此 ， 一 个 有 
10 个 元 素 的 数组 ， 其 索引 值 为 0、1、2、3、4、5、6、7、8 和 9。 


11.3.2 ”数组 元 素 的 选择 


为 了 引用 数组 中 的 某 个 元 素 ， 需 要 给 出 数组 名 和 数组 中 相应 元 素 的 索引 位 置 。 这 种 在 数 
组 中 识别 特定 元 素 的 过 程 被 称 为 选择 (selection). fk C++ 语言 中 ， 通 过 数组 名 加 上 方 括号 
内 的 元 素 索引 值 表 示 和 你 在 矢量 中 选择 一 个 元 素 一 样 。 

选择 表达 式 的 结果 为 一 个 左 值 ， 这 就 意味 着 你 可 以 给 它 赋 值 。 例 如 ， 如 果 你 执行 for 
循环 : 

for (int i = 0; i < N ELEMENTS; i++) ( 


intArray[i] = 10 * i; 
} 


数组 intArray 会 被 初始 化 为 如 下 图 所 示 的 情况 : 
intArray 
当 你 从 数组 中 选择 一 个 元 素 时 ，C++ 不 进行 数组 边界 的 检查 。 如 果 索 引 越界 ，C++ 语言 
会 试图 在 内 存 中 寻找 该 索引 所 指向 的 内 存单 元 的 值 并 使 用 它 ， 这 会 导致 不 可 预期 的 结果 。 更 
糟 的 是 ， 如 果 你 给 该 元 素 赋 一 个 新 值 ， 你 可 能 会 覆盖 了 程序 其 他 部 分 的 内 存 内容 。 数 组 越界 
是 黑客 攻击 计算 机 系统 的 一 个 致命 点 。 


11.3.3 ”数组 的 静态 初始 化 


数组 可 以 在 声明 时 赋 初 值 。 在 这 种 情况 下 ， 等 号 后 面 是 由 一 对 花 括 号 括 起 来 的 一 行 初始 
值 。 例如 ， 以 下 声明 : 


const int DIGITS[] = (0, 1, 2, 3, 4, 5, 6, 7, 8, 9 y; 


声明 了 一 个 常量 数组 DIGITS, Ah 10 个 元 素 分 别 以 下 标 数 进行 初始 化 。 可 以 从 该 例子 中 
看 出 ， 明 确 初始 化 允许 你 忽略 数组 容量 ,但 可 以 从 初始 化 的 数值 的 数目 中 推断 得 出 。 

在 DIGITS 一 例 中 ， 你 知道 数组 中 有 10 个 数 。 然 而 ， 在 许多 情况 下 ， 程 序 需要 在 一 个 
静态 声明 的 数组 中 判断 元 素数 目 ， 使 得 程序 员 不 用 在 每 一 次 程序 改变 时 再 依次 数 元 素数 目 。 
例如 ， 想 象 你 在 编写 一 个 程序 ， 该 程序 要 求 逐 个 包含 美国 所 有 人 口 超过 1 000 000 的 城市 名 。 
从 2010 年 的 人 口 普 查 中 获取 数据 ， 你 可 以 通过 以 下 方式 声明 和 初始 化 BIG_CITIES 为 一 个 
全 局 常量 数组 : 


const string BIG CITIES[] = { 
"New York", 
"Los Angeles", 
"Chicago", 
"Houston", 
"Philadelphia", 
"Phoenix", 
"San Antonio", 
"San Diego", 
"Dallas", 
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但 是 ， 这 个 清单 数据 是 随时 间 变 化 的 。 在 1990 年 和 2000 年 的 人 口 调查 结果 中 ， 底 特 律 从 
清单 中 消失 ， 而 菲尼克斯 和 圣安东尼奥 加 入 到 该 清单 。 若 取 来 自 于 2020 年 的 人 口 普 查 结果 
的 话 ， 圣 何 塞 很 有 可 能 会 加 进来 。 如 果 你 负责 维护 包含 这 段 代 码 的 程序 ， 永 远 不 要 想 着 清单 
中 有 多 少 个 城市 ， 也 不 要 想 着 程序 能 判断 有 多 少 个 元 素 。 反 之 ， 你 可 能 需要 更 新 清单 中 的 城 
市 ， 并 且 使 编译 器 了 解 到 其 数量 。 

幸运 的 是 ，C++ 语言 提供 了 一 个 标准 的 习 语 来 确定 静态 声明 得 到 的 数组 的 容量 ， 然 后 根 
据 其 设置 元 素数 目 。 给 定 一 个 静态 初始 化 的 数组 MY_RARRAY，MY_RARRRAY 的 元 素 个 数 可 以 
这 样 计算 出 来 : 


sizeof MY ARRAY / sizeof MY_ARRAY[0] 


该 表达 式 获取 整个 数组 的 容量 除 以 数组 中 每 个 元 素 大 小 。 因 为 数组 的 同 质 性 ， 运 算 结果 就 是 
497] 数组 元 素 的 数目 ， 与 元 素 类 型 无 关 。 因 此 你 可 以 如 下 初始 化 一 个 变量 N_BIG_CITIES 来 存 
储 bigcities 数组 的 城市 数目 : 


const int N BIG CITIES = sizeof BIG CITIES / 
sizeof BIG CITIES[0]; 


11.34 ”有 效 容量 和 分 配 容量 


尽管 sizeof 允许 你 确定 静态 数组 的 大 小 ， 但 是 当 你 编写 代码 时 ， 有 许多 应 用 你 没 办 
法 知道 一 个 数组 该 多 大 ， 因 为 元 素 实 际 的 数目 取决 于 用 户 数据 。 解 决 选择 一 个 合适 的 数组 容 
量 问题 的 策略 是 : 声明 一 个 比 你 需求 大 的 数组 ， 然 后 只 使 用 其 中 的 一 部 分 。 因 此 ， 定 义 一 个 
常量 表示 数组 元 素数 目 有 最 大 值 并 以 此 来 声明 数组 ， 而 不 是 定义 一 个 可 以 存储 元 素 实 际 数 
目的 数组 。 在 任何 给 定 用 途 的 程序 中 ， 元 素 的 实际 数目 都 要 小 于 其 边界 。 当 你 使 用 这 个 策略 
时 ， 你 需要 一 个 单独 的 整 型 变量 来 跟踪 实际 用 到 的 元 素 的 数目 。 在 声明 中 ,指定 数组 容量 的 
被 称 为 分 配 容量 (allocated size)。 实 际 使 用 到 的 元 素数 目 被 称 为 有 效 容量 (effective size). 

例如 ， 假 设 你 想 定 义 一 个 数组 来 存储 体操 运动 员 的 分 数 ， 裁 判 会 在 一 个 记分 牌 上 给 每 一 
个 选手 打分 ， 打 分 范围 为 0.0 到 10.0， 到 2005 年 之 前 的 奥林匹克 运动 会 都 采用 这 个 打分 规则 。 
如 果 你 想 让 程序 最 多 有 一 百 个 裁判 (尽管 实际 数目 会 更 小 )， 你 可 能 需要 这 样 定义 这 个 数组 : 

const int MAX JUDGES = 100; 


double scores[MAX JUDGES]; 


为 了 跟踪 有 效 容量 ， 你 需要 声明 另 一 个 称 为 ndudges 的 变量 ， 并 且 保 证 它 能 够 跟踪 实际 裁 
判 的 数量 。 


11.3.5 “指针 和 数组 的 关系 
在 C++ 中 ， 数 组 名 和 指向 其 第 一 个 元 素 的 指针 同 义 。 其 同一 性 最 好 用 示例 说 明 。 声 明 


int list[5]; 
给 数组 分 配 了 五 个 整 型 数据 的 内 存 ， 并 且 将 内 存 存 储 到 当前 的 栈 帧 中 ， 如 下 图 所 示 : 


list[0] 
list[1] 
list[2] 
list[3] 
list[4] 
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数组 名 list 表示 一 个 数组 ， 但 是 同时 被 用 作 一 个 指针 值 。 当 它 被 用 作 一 个 指针 时 ， 
list 被 定义 成 数组 中 首 元 素 的 地 址 。 因 此 ， 如 果 编 译 器 遇 到 变量 名 list 没 带 下 标 ， 它 会 
将 该 数组 名 解释 为 一 个 指向 数组 开始 内 存 的 指针 变量 。 
C++ 将 数组 视 为 指针 的 一 个 最 重要 的 原因 是 数组 形 参 和 实 参 共 享 ， 尽 管 并 没有 涉及 任何 
明确 调用 。 例 如 ， 你 可 以 如 下 实现 一 个 基于 数组 的 选择 排序 算法 版 本 : 
void sort(int array[], int n) ( 
for (int lh = 0; lh < n; lh**) { 
int rh - lh; 
for (int i = Ih +1; i <n; it*) { 
if (array[i] < array[rh]) rh = i; 
} 
swap(array[lh], array[rh]); 


} 
} 


这 个 函数 会 将 调用 的 数组 排序 ， 因 为 函数 通过 复制 正在 调用 的 参数 地 址 来 初始 化 数组 参数 。 
函数 接着 用 该 地 址 选择 数组 元 素 ， 这 就 意味 着 这 些 元 素 是 正在 调用 参数 数组 的 元 素 。 
如 果 你 将 函数 原型 写成 以 下 形式 ，sort 函数 将 会 实现 相同 的 功能 : 


void sort(int *array, int n) 


在 该 函数 中 ， 第 一 个 参数 被 声明 为 一 个 指向 数组 的 指针 ， 但 其 效果 与 原来 的 将 其 声明 为 一 个 
数组 的 实现 相同 。 在 前 一 种 情况 下 ， 在 数组 名 array 下 的 栈 帧 中 存储 的 数值 是 正在 调用 的 
参数 首 元 素 的 地 址 。 在 机 器 内 部 ， 这 两 种 声明 是 等 价 的 。 不 管 在 声明 中 使 用 哪 种 形式 ， 都 能 
对 变量 array 进行 相同 的 操作 。 

作为 一 个 普遍 规则 ， 你 需要 用 能 反映 它们 用 途 的 方式 来 声明 参数 。 如 果 你 打算 将 一 个 数 
组 作为 参数 并 且 从 中 选择 元 素 ， 那 就 将 其 参数 声明 为 一 个 数组 。 如 果 你 打算 将 一 个 指针 或 者 
引用 作为 参数 ， 那 就 将 其 声明 为 指针 。 

在 C++ 中， 指针 和 数组 最 关键 的 区 别 是 ， 当 变 量 被 声明 时 就 会 进入 角色 ， 而 不 是 在 这 
些 变量 被 作为 参数 传递 时 。 声 明 


int array[5]; 


和 

int *p; 
基本 的 区 别 是 内 存 分 配 。 第 一 个 声明 会 得 到 五 个 连续 字 的 内 存 ， 它 足以 存储 数组 元 素 。 第 二 
个 声明 仅 获 得 一 个 字 的 内 存 ， 它 足以 存储 一 个 机 器 地 址 。 将 上 述 声 明 的 区 别 谨 记 在 心 是 非常 
重要 的 。 如 果 你 声明 一 个 数组 ， 你 必须 要 有 存储 空间 来 处 理 它 。 如 果 你 声明 一 个 指针 变量 ， 
除非 你 对 它 初始 化 ， 否 则 它 就 不 能 存储 。 

将 一 个 指针 初始 化 为 数组 的 最 简单 的 方式 是 : 将 存在 的 数组 的 首 地 址 复制 给 该 指针 变 
量 。 例如， 如 果 在 前 面 进行 了 声明 ， 那么 你 就 要 编写 以 下 语句 : 

P = array; 
它 将 变量 p 指向 array 的 地 址 ， 之 后 你 就 可 以 交替 使 用 这 两 个 名 字 了 。 

将 一 个 已 存在 的 数组 的 首 地址 赋 给 指针 有 严格 的 限制 。 毕 竟 ， 如 果 你 已 经 有 一 个 数组 
名 ， 你 最 好 使 用 它 ， 把 它 赋 给 一 个 指针 并 不 是 上 策 。 将 指针 作为 数组 使 用 的 真正 优势 是 你 可 
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以 将 一 个 指针 初始 化 为 之 前 未 分 配 的 新 内 存 首 址 ， 以 允许 你 在 程序 运行 时 创建 一 个 新 数组 。 
该 技术 将 在 第 12 章 进 行 讲 述 。 


11.4 ”指针 运算 


在 C++ 语言 中 ， 指 针 可 以 使 用 操作 符 + 和 -。 这 种 计算 和 普通 算术 运算 有 相似 之 处 ， 
但 又 不 完全 一 样 。 这 种 对 指针 进行 加 减 运算 的 运算 被 称 为 指针 运算 (pointer arithmetic). 

指针 运算 定义 的 规则 很 简单 。 如 果 p 指向 命名 为 array 数组 的 首 元 素 ，k 是 一 个 整数 ， 
以 下 等 价 总 是 成 立 的 : 


p*k 定义 为 &array[k] 


换 名 话说， 如 果 你 将 一 个 指针 值 与 一 个 整数 kx 相 加 ， 其 返回 结果 就 是 取 索 引 k 处 数组 元 素 
的 地 址 。 


11.4.1 数组 索引 和 内 存 地 址 


为 了 更 好 地 理解 指针 运算 如 何 实 现 ， 考 虑 一 个 涉及 数组 存储 如 何 分 配 到 内 存 例 子 。 例 
如 ， 假 设 一 个 函数 包含 如 下 声明 

double list[3] = ( 1.61803, 2.71828, 3.14159 }; 

double *p - list; 
这 些 变量 都 会 在 该 函数 的 栈 帧 内 分 配 空间 。 对 于 数组 变量 1i st ,编译 器 给 数组 中 的 三 个 元 
素 分 配 内 存 ， 每 一 个 都 足以 存储 一 个 双 精 度 浮 点 数 。 对 指针 p 而 言 ， 编 译 器 给 指针 分 配 足够 
的 内 存 ， 用 来 表示 类 型 为 double 的 左 值 的 地 址 。 

在 该 示例 中 ， 也 给 出 了 数组 的 初始 元 素 。 数 组 list 的 元 素 被 初始 化 为 1.618 03, 2.718 28 
和 3.141 59。 声 明 


double *p = list; 


初始 化 p 来 使 它 能 够 存储 数组 的 起 始 地 址 。 如 果 栈 帧 从 FFAO 单元 开始 ， 内 存 分 配 情况 如 下 
图 所 示 : 


E 
2.71828 


3.14159 


ERF, p 当前 指向 数组 1ist 的 初始 地 址 。 如 果 将 整数 k 和 指针 p 相 加 ， 返 回 结果 为 
k 位 置 索引 所 对 应 的 地 址 。 例 如 ， 如 果 一 个 程序 包含 以 下 表达 式 : 


P + 2 


该 表达 式 的 计算 结果 是 一 个 新 的 指向 包含 1ist [2] 的 地 址 的 指针 。 因 此 ， 在 前 面 的 图 中 ， 
p 包含 地 址 FFA0，p+2 指向 数组 中 第 三 个 元 素 的 地 址 ， 即 FFB0。 

注意 到 指针 加 法 运算 和 传统 的 加 法 运算 并 不 完全 等 价 ， 因 为 编译 器 必须 考虑 基 类 型 的 空 
间 大 小 。 在 该 例 中 ， 每 一 个 加 到 指针 的 整数 相当 于 double 类 型 的 大 小 ， 即 8 个 字 节 。 
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C++ 编译 器 以 同样 的 方式 处 理 指针 相 减 。 如 果 p 是 一 个 指针 变量 ，k 是 一 个 整数 ， 下 列 
表达 式 : 

p-k 
计算 出 指针 p 指向 的 当前 地 址 之 前 k 个 位 置 的 数组 元 素 的 地 址 。 因 此 ， 你 如 果 要 使 用 以 下 
语句 设置 p 指向 1ist [1] 的 地 址 : 


p = &list[1]; 


那么 p+1 和 p-1 分 别 对 应 的 地 址 为 1ist[0] Mlist[2]. 

算术 运算 *、/ 和 s$ 在 指针 运算 中 没有 意义 ， 且 其 运算 结果 不 能 作为 指针 操作 数 使 用 。 
而 且 ， 运 算 + 和 - 也 是 有 约束 的 。 在 C 语言 中 ， 指 针 可 以 加 或 减 一 个 整数 ， 但 是 不 能 进行 
指针 相 加 ， 减 是 唯一 可 以 进行 指针 相 减 运算 的 算术 操作 符 。 以 下 表达 式 : 

pl - P2 
返回 当前 两 个 指向 同一 数组 的 指针 pl Al p2 之 间 的 数组 元 素 的 个 数 。 例 如 ， 若 pl 指向 
list[2], p2 指向 1ist[0] ， 那 么 表达 式 


pl - p? 


的 值 为 2， 因 为 在 当前 两 个 指针 之 间 有 两 个 元 素 。 


11.4.2 ”指针 的 自 增 自 减 运 算 
了 解 了 指针 运算 的 规则 ， 我 们 就 能 更 好 地 理解 C++ 语言 一 个 最 为 常见 的 语法 结构 ， 如 
以 下 表达 式 所 示 : 


*ptt 


在 该 表达 式 中 ，* 操作 符 和 ++ 操作 符 均 要 对 操作 数 p 进行 运算 。 但 是 C++ 中 的 一 元 操作 符 
的 运算 顺序 是 从 右 向 左 的 ， 所 以 ++ 先 运算 ， 接 下 来 是 *， 所 以 编译 右 就 会 这 样 解释 这 个 表 
达 式 : 


* (p++) 


我 们 在 第 1 RFA, AA ++ RERE p 的 值 加 一 ， 然 后 返回 p 增加 前 的 值 。 因 为 p 是 
一 个 指针 ， 所 以 自 增 运算 满足 指针 运算 规则 。 因 此 ，p 值 加 1 产生 了 指向 数组 中 下 一 个 元 素 
的 指针 。 如 果 p 原先 指向 arr [0] ,那么 自 增 操作 以 后 会 使 其 指向 arr [1] 。 因 此 ， 表 达 式 


*ptt 


有 如 下 的 解释 : 
解析 指针 P， 并 且 返 回 一 个 当前 指针 所 指 的 左 值 。 因 此 ，P 值 自 增 运算 的 效果 使 得 如 果 
原先 的 左 值 是 数组 中 的 一 个 元 素 ， 那 么 p 的 新 值 就 是 指向 那个 元 素 的 下 一 个 元 素 的 指针 。 


11.4.8 C 风格 字符 串 


解释 *p++ 这 一 习惯 用 法 的 最 佳 方式 是 在 一 个 处 理 C. 风格 字符 串 代 码 的 上 下 文中 看 它 最 
有 可 能 的 使 用 方式 。 从 第 3 章 你 已 经 知道 ，C++ 使 用 两 种 不 同 的 字符 串 类 型 。 到 目前 为 止 ， 
最 容易 使 用 的 就 是 <string> 接口 输出 的 类 string， 该 类 定义 了 一 个 高 层 的 操作 集合 以 
使 得 字符 串 操 作 相对 容易 。 然 而 ， 由 于 历史 的 原因 ，C++ 支持 一 个 更 基本 的 ， 继 承 自 C 语 
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言 的 字符 串 模型 。 在 C 语言 中 ,字符 串 就 是 一 个 以 \0 结尾 的 字符 数组 ，\0 被 称 为 空 字 符 
(null character)。 例 如 ， 如 果 你 在 一 个 C++ F ERFARA HE "hello, world", 编译 
器 将 会 在 内 存 中 产生 一 个 字符 数组 ， 该 数组 包含 字符 串 中 的 所 有 元 素 外 加 一 个 空 字符 ， 如 下 


图 所 示 : 


如 图 所 示 ，C 风格 的 字符 串 并 不 是 明确 存储 为 数据 结构 的 一 部 分 ， 而 是 以 一 个 空 字符 
来 表示 结束 。 如 果 你 需要 知道 C 风格 字符 串 的 长 度 ， 需 要 从 开始 数 到 结尾 。 在 标准 C 库 中 ， 
这 个 操作 可 由 strlen 函数 来 完成 ， 该 函数 支持 许多 不 同 的 使 用 方式 。 例 如 ， 下 面 的 实现 
声明 了 一 个 字符 数组 作为 参数 ， 并 且 使 用 数组 选择 来 按 顺 序 查看 每 一 个 字符 : 
int strlen(char str[]) ( 
int n = 0; 
while (str[n] != '\0') { 
ntt; 
) 


return n; 


) 
然而 ， 该 实现 可 以 使 用 如 下 代码 进行 替换 ， 该 函数 将 一 个 字符 指针 作为 参数 : 


int strlen(char *cp) { 
int n = 0; 
while (*cp++ != '\0') ( 
ntt; 
) 


return n; 


} 


在 这 个 版 本 中 ，while 循环 按 顺 序 检测 每 一 个 字符 是 否 为 空 字符 。 同 时 表达 式 *cp++ 使 字 
符 指 针 自 动向 前 检查 字符 串 的 下 一 个 字符 。 然 而 ， 使 指针 向 前 直到 结尾 ， 然 后 使 用 指针 下 标 
来 确定 字符 数目 ， 这 会 显得 更 为 高 效 : 


int strlen(char *str) ( 
char *cp; 
for (cp = str; *cp != '\0'; cp++); 
return cp - str; 


} 


注意 for 循环 由 一 个 分 号 终止 ， 表 明 循 环 体 为 空 ， 而 同时 出 现 一 些 初始 化 、 测 试 和 步 长 表 
达 式 。 

如 果 你 在 一 个 应 用 中 直到 一 些 类 似 于 对 字符 串 进行 操作 的 代码 ， 其 实现 一 般 会 省 去 通 
过 显示 的 比较 来 判定 当前 字符 不 为 空 。 在 C 和 C++ 中 ， 如 果 一 个 整数 不 为 零 ， 那 就 代表 
true。 表 达 式 *cp++ 可 以 说 明 这 一 规则 ， 当 该 表达 式 为 true 时 ， 其 值 一 定 不 等 于 空 字 
符 ， 空 字符 对 应 着 ASCII 的 码 值 0。 

涉及 指针 运算 的 代码 会 比 之 前 的 例子 显得 更 加 模糊 。C 标准 库 中 stropy 函数 的 实现 就 
是 将 src 中 C 风格 的 字符 串 拷 贝 到 字符 数组 ast 中 ， 如 下 所 示 : 
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void strcpy(char *dst, char *src) ( 

while (*dst++ = *srct*):; LA 
) 
while 循环 的 主体 是 空 的 ， 所 有 的 工作 都 在 下 面 这 个 高 度 线性 化 的 表达 式 中 完成 : 


*dstt- = *srctt 


该 表达 式 的 作用 是 将 当前 scc 指向 的 字符 复制 到 地 址 asc 中 ， 并 且 在 该 过 程 中 两 指针 同时 
自 增 1。 只 有 当代 码 将 字符 串 结尾 的 空 字符 复制 时 ， 表 达 式 结果 才 变 成 0， 也 就 是 false。 

正如 你 所 看 到 的 ， 尽 管 代 码 从 技术 上 说 没什么 问题 ， 但 stropy 的 定义 被 标记 上 错误 
图 标 。strcpy 的 实现 精确 地 表达 了 C++ 详细 说 明 的 内 容 。 问 题 (同时 也 是 做 错误 标记 的 
原因 ) 是 由 于 C++ 继承 自 旧 的 CR, stropy 的 具体 实现 使 得 该 函数 使 用 起 来 极度 危险 。 
主要 是 因为 strcpy 并 不 检查 目的 指针 数组 是 否 有 足够 的 空间 来 存储 源 字符 串 的 一 个 复制 。 
如 果 内 存 不 足以 存储 完整 的 源 字 符 串 ，stzrcpy 会 继续 向 前 并 为 有 其 他 分 配 目的 的 内 存 复制 
额外 的 字符 。 这 种 问题 被 称 为 缓冲 区 溢出 错误 (buffer overflow error). 

缓冲 区 溢出 错误 经 常会 以 一 种 极 难 调试 的 形式 导致 程序 莫名 其 妙 地 崩溃。 然而 ， 这 种 
类 型 的 错误 引起 的 问题 会 比 错误 本 身 更 加 严重 。 没 有 检查 缓冲 区 溢出 的 应 用 程序 会 在 调用 
stropy 时 更 有 可 能 陷入 严重 的 安全 风险 。 通 过 人 允许 strcpy 向 不 足 的 内 存 空间 复制 精心 挑 
选 的 字符 串 ， 攻 击 者 能 够 用 这 些 恶 意 的 代码 重 写 某 些 应 用 来 获得 计算 机 的 控制 权 。 


11.4.4 ”指针 运算 和 程序 风格 


由 于 历史 的 原因 ， 许 多 C++ 程序 员 会 在 使 用 数组 更 简单 的 地 方 使 用 指针 运算 来 处 理 问 
题 。 除 了 本 章 为 了 阐明 概念 使 用 的 代码 外 ， 本 文 的 示例 都 尽量 避免 指针 运算 ， 而 借助 于 数组 
索引 来 提高 可 靠 性 。 通 常情 况 下 ， 一 般 建 议 在 自己 的 代码 中 也 这 样 做 。 

如 果 你 曾经 负责 维护 过 代码 ， 肯 定 遇 到 过 *p++ 这 样 的 情况 ， 可 能 还 有 很 多 更 上 涩 的 指 
针 运算 示 例 。 既 然 维护 代码 是 编程 过 程 中 的 一 个 关键 部 分 ， 就 需要 了 解 指针 运算 是 如 何 进 行 
的 。 标 准 模板 库 正 是 使 用 *p++ 的 语法 模式 来 实现 迭代 器 的 ， 这 将 在 第 20 章 进行 介绍 。 到 
那 时 ， 记 住 *p++ 是 C++ 中 检索 一 个 数组 的 当前 元 素 并 且 将 索引 指向 下 一 个 元 素 的 简写 是 
非常 有 帮助 的 。 


本 章 小 结 
本 书 的 目标 之 一 就 是 鼓励 你 使 用 高 级 结构 ， 这 能 让 你 独立 于 底层 实现 以 抽象 思维 来 思考 
数据 。 抽 象 数 据 类 型 和 类 能 够 帮助 实现 这 一 全 局 观点 。 同 时 ， 想 要 高 效 地 使 用 C++ B A 
要 你 对 数据 结构 如 何在 内 存 中 表示 要 心中 有 数 。 在 本 章 ， 你 有 机 会 看 到 了 这 些 数据 结构 如 何 
存储 的 ， 并 且 了 解 了 当 你 编写 程序 时 其 底层 是 如 何 运 行 的 。 
本 章 的 重点 包括 : 
e 现代 计算 机 信息 的 基本 存储 单元 是 位 ， 它 有 两 种 状态 。 内 存 图 中 一 般 用 二 进 制 数 0 
和 1 来 表示 位 的 状态 ,但 是 就 应 用 而 言 ， 将 其 想象 成 false 和 true, 或 者 off 和 
on， 二 者 是 等 价 的 。 
e 在 硬件 中 ， 位 序列 的 组 合 构成 了 更 大 的 数据 结构 ， 包 括 字 节 (一 个 字 节 有 8 位 ) RU 
(一 个 字 有 32 位 或 64 位 ， 这 取决 于 机 器 结构 )。 
e 计算 机 的 内 存 是 按 字 节 序列 分 配 的 ， 每 个 字 节 由 它 在 序列 中 的 索引 位 置 区 分 ， 该 位 
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置 又 被 称 为 地 址 。 
e 计算 机 科学 家 倾向 于 以 十 六 进 制 来 表示 地 址 值 以 及 内 存单 元 的 数据 ， 因 为 这 样 做 使 
得 甄别 单个 位 变 得 简单 。 
C++ 的 基本 数据 类 型 要 求 不 同 的 内 存 容 量 。 一 个 char 类 型 的 值 需要 一 个 字 节 ， 而 
int 类 型 的 值 一 般 要 求 四 个 字 节 ， 而 double 类 型 的 值 则 要 求 八 个 字 节 。 
e 内 存 中 的 地 址 本 身 也 是 由 数字 表示 的 ， 也 可 以 像 数 字 一 样 被 操作 。 表 示 其 他 数据 地 
址 的 数据 称 为 指针 。 在 C++ 中 ， 指 针 变 量 的 声明 是 在 声明 变量 时 在 变量 名 前 加 上 
星 号 。 
指针 的 基本 操作 符 是 和 *， 分别 表示 获取 存储 数据 的 地 址 和 获取 存 于 某 个 地 址 中 
的 数据 。 
在 C++ 程序 中 创建 的 数据 值 会 根据 情况 被 分 配 在 不 同 的 内 存 区 域 。 静 态 变 量 以 及 常 
量 被 分 配 在 专门 存储 程序 代码 和 静态 数据 的 内 存 区 。 局 部 变量 被 分 配 在 栈 区 ， 一 个 
方法 或 函数 的 所 有 局 部 变量 都 被 分 配 在 一 个 栈 帧 中 。 在 第 12 章 将 会 看 到 ， 程 序 在 运 
行 时 会 动态 分 配额 外 的 内 存 。 
e 关键 字 this 表示 指向 当前 对 象 的 指针 。 
e C++ 使 用 操作 符 -> 来 选择 某 个 结构 或 对 象 的 成 员 ， 当 然 该 操作 符 的 左 操作 数 必须 
为 指针 变量 。 
e 常量 NULL 用 来 表示 不 指向 任何 对 象 的 空 指针 。 
e 在 C++ 中 ， 通 过 在 栈 帧 中 存储 一 个 指向 调用 参数 的 指针 来 形成 引用 参数 。 
e 和 大 多 数 编程 语言 一 样 ，C++ 包含 一 个 内 置 的 用 于 存储 一 个 有 序 的 、 同 质 元 素 的 集 
合 的 数组 。 正 如 在 一 个 矢量 中 ， 数 组 中 的 元 素 都 以 0 开始 的 整 型 索引 。 
数组 声明 是 在 数组 名 后 面 的 方 括号 内 以 常量 说 明 其 容量 。 声 明 的 容量 就 是 该 数组 的 
分 配 容量 ， 一 般 大 于 数组 中 元 素 实 际 使 用 的 有 效 容量 。 
C++ 中 数组 名 在 内 部 被 解释 为 一 个 指向 其 首 元 素 的 地 址 。 这 种 设计 的 一 个 重要 的 作 
用 是 将 数组 作为 参数 传递 而 不 复制 其 元 素 ， 且 由 函数 将 数组 的 地 址 存储 在 调用 方 。 
最 后 ， 如 果 一 个 函数 改变 了 作为 参数 传递 的 数组 的 任何 一 个 元 素 ， 这 些 改变 对 于 调 
用 者 是 可 见 的 。 
C++ 定义 了 指针 运算 ， 当 整数 和 指针 相 加 时 ， 得 到 的 结果 是 距离 指针 指向 元 素 向 下 
数 一 定 数目 后 的 元 素 的 地 址 。 因 此 ， 如 果 指 针 p 指向 array[0] ， 则 表达 式 p+2 的 
结果 是 指向 array[2]。 
e *p++ 的 惯用 模式 是 返回 p 当前 所 指 对 象 的 值 ， 然 后 p 加 1 指向 数组 的 下 一 个 元 素 。 


复习 题 

1. 定义 以 下 几 个 概念 : 位 、 字 节 和 字 。 

2. 单词 “bit” 的 词 源 是 什么 ? 

3. 2GB 内 存 的 机 器 有 多 少 字 节 ? 

4. 将 下 面 十 进 制 数 转换 成 十 六 进 制 数 : 
a) 17 c) 1729 
b) 256 d) 2766 

5. 将 下 列 十 六 进 制 数 转 换 成 十 进 制 数 : 


a) 17 
b) 64 
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e) cc 
d) FADE 


6. C++ 给 一 个 char 类 型 值 分 配 多 少 字 节 ? 那 double 类 型 呢 ? 

7. 判断 题 : 在 C++ 中 ，char 类 型 的 值 总 是 需要 一 个 字 节 内 存 。 

8. 判断 题 : 在 C++ 中 ，int 类 型 的 值 总 是 需要 四 个 字 节 内 存 。 

9. 如 果 一 个 机 器 使 用 补 码 来 表示 负数 ， 那 么 -7 在 32 位 的 整 型 格式 中 的 内 部 表示 是 多 少 ? 
10. 内 存 的 三 个 区 域 是 什么 ， 分 别 可 以 存储 哪些 类 型 的 数据 ? 


LL. 
12. 


13. 


14. 


15. 


16. 
17. 
18. 


19. 
20. 
. 如 何 使 用 指针 实现 引用 调用 ? 


2 
22. 


— 


sizeof 操作 的 作用 是 什么 ?如 何 使 用 ? 
什么 叫做 地 址 ? 

什么 叫做 左 值 ? 

本 章 曾 明了 哪些 使 用 指针 的 原因 ? 

下 面 声明 的 变量 类 型 分 别 是 什么 : 


int * pl, p2; 


指针 的 两 个 基本 运算 是 什么 ? 哪 一 个 是 取 值 运算 ? 
解释 指针 赋值 和 普通 赋值 的 差异 。 


假定 int 类 型 变量 和 所 有 的 指针 都 需要 四 个 字 节 内 存 ， 


10; 
255 
int *pl = &vl; 
int *p2 - &v2; 


在 你 的 图 中 ,追踪 以 下 语句 的 操作 : 

*pl += *p2; 

p2 = pl; 

*p2 = *pl + *p2; 

判断 题 : 对 任何 变量 x， 表 达 式 *&x 与 x 同 义 。 
判断 题 : 对 任何 变量 p， 表 达 式 &*p 与 p 同 义 。 


int vl 


int v2 


写 出 下 面 数组 变量 的 声明 : 

a) 数组 realArray 包含 100 个 浮 点 数 。 

b) 数组 inUse 包含 16 个 布尔 值 。 

c) 数组 lines 可 容纳 1000 个 字符 串 。 

着 记 声 明 常量 以 指定 这 些 数 组 所 分 配 的 容量 。 


画图 表示 包含 下 列 声明 的 栈 帧 : 


23. 写 出 变量 声明 和 必要 的 for 循环 来 创建 和 初始 化 下 面 的 整 型 数组 : 


24. 
25. 


序列 


KEIKREREREILAEILILILSLAJ 
0 1 2 3 4 5 6 7 8 9 10 


分 配 容 量 与 有 效 容量 的 区 别 是 什么 ? 
假设 intArray 声明 为 : 


int intArray[10]; 


j 是 一 个 整 型 变量 ， 描 述 计 算 机 执行 下 面 表达 式 的 步骤 : 


&intArray[j + 3]; 
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26. 如 果 array 被 声明 为 一 个 数组 ， 描 述 表 达 式 
array[2] 


与 表达 式 


array + 2 


的 区 别 。 

27. 假定 在 你 所 用 的 系统 上 ， 一 个 double 型 变量 占用 八 个 字 节 内 存 。 如 果 doubleArray 基 址 为 
FF00, 那么 doubleArray+5 的 地 址 值 是 多 少 ? 

28. 判断 题 : 如果 p 是 一 个 指针 变量 ， 表 达 式 p++ 表示 p 的 内 部 表示 加 1。 

29. 描述 表达 式 *p++ 的 作用 。 


*ptt 
30. 在 表达 式 *p++ 中 ， 哪 个 操作 符 (+ 或 ++) 先 运算 ? 通常 ，C 语言 一 元 操作 符 的 运算 规则 是 什么 ? 
习题 


1. 从 本 章 你 了 解 到 ， 整 数 在 计算 机 内 部 由 一 连 串 位 表示 ， 每 一 个 位 是 二 进 制 计数 系统 的 一 个 数字 ， 即 
0 或 1。YX 个 位 可 以 表示 2N 个 不 同 整 数 。 例 如 ，3 个 位 足以 表示 0 到 7 之 间 的 8 个 整数 ， 如 下 所 示 : 


001 一 
a 


这 些 整 数 的 位 表示 遵循 一 个 递归 模式 。N 位 二 进 制 数 包含 下 面 两 种 数据 集合 : 
* 以 0 开头 , 后 面 有 N-1 位 的 二 进 制 数 。 

。 以 1 开头 , 后 面 有 N-l 位 的 二 进 制 数 。 

5i 3 B UH PRU : 


void generateBinaryCode(int nBits); 


它 可 以 生成 用 特定 位 数 所 表示 的 所 有 的 二 进 制 数 。 例 如 ， 调 用 generateBinaryCode (3) 应 该 产 
生 如 下 输出 : 





i ee ee M us PITT 


2. 尽管 对 于 大 多 数 应 用 程序 而 言 ， 习 题 1 的 二 进 制 编码 显得 非常 理想 ， 但 是 它 还 是 有 一 定 的 缺陷 。 从 
标准 二 进 式 可 以 看 出 : 在 某 些 点 上 ， 位 序列 会 同时 改变 好 几 位 。 例 如 ,在 三 位 二 进 制 编码 中 ， 从 
3(011) 到 4(100) 的 每 位 都 发 生 了 变化 。 

在 一 些 应 用 程序 中 ， 使 用 这 种 位 模式 表示 相 邻 数字 会 引发 问题 。 想 象 一 下 你 在 使 用 一 个 硬件 度 
量 设备 ， 该 设备 恰好 要 产生 三 位 二 进 制 数 表示 3 和 4。 有时， 设备 要 产生 011 来 表示 3， 有 时 则 要 
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以 100 表示 4。 为 了 使 该 设备 正确 工作 ， 每 位 所 进行 的 转变 必须 同步 。 如 果 第 一 位 快 于 其 他 位 ， 设 
备 就 会 额外 产生 一 些 中 间 状 态 ， 可 能 是 111， 这 将 是 一 个 很 不 精确 的 结果 。 
事实 证 明 ， 你 可 以 通过 改变 数字 系统 来 避免 此 问题 。 你 可 以 在 表示 中 控制 相 邻 两 数 的 二 进 制 表 
示 使 其 只 有 一 位 变化 以 给 0 到 7 赋 3- 位 二 进 制 数 。 这 种 编码 方式 被 称 为 格雷 码 〈 Gray code) (以 它 [S11 
的 发 明 者 数学 家 弗兰克 ' 格雷 命名 )， 表 示 如 下 : 


0 
1 
2 
3 
110 — 4 
5 
6 
7 


在 格雷 码 表 示 中 ，3 和 4 只 有 一 位 不 同 。 如 果 该 设备 采用 格雷 码 ， 值 在 3 和 4 之 间 振 荡 时 ， 不 同 的 
位 会 立刻 变换 状态 ， 不 会 出 现 同步 的 问题 。 

创建 N 位 格雷 码 的 递归 思想 如 以 下 总 结 的 步骤 所 示 : 

1) 写 出 N-1 位 的 格雷 码 。 

2) 按 相反 顺序 复制 序列 ， 并 将 其 放 在 原始 序列 的 下 面 。 

3) 在 原先 编码 的 序列 前 加 0， 再 在 反 转 后 的 序列 前 加 1。 

下 图 说 明了 3- 位 格雷 码 的 形成 过 程 : 


3- 位 格雷 码 2- 位 格雷 码 1- 位 格雷 码 
000 
001 
011 00 
010 "I et 
110 11 反 1 
111 多 af 
101 
100 
a 53 — 1 38 VH PRI generateGrayCode (nBits) 来 生成 给 定位 数 的 格雷 码 。 例 如 ， 如 果 调 用 以 
FERAE: 512 
generateGrayCode (3) 
程序 将 会 产生 如 下 输出 : 





— " et . : 了 
3 I det ebria ines pq c we, er E — ai A 





.编写 integerToString Al stringToInteger 重 载 函数 版 本 ， 取 第 二 个 表示 基数 的 参数 ， 该 基 
数 是 一 个 2 到 36 的 整数 〈 十 进 制 数 加 上 26 个 字母 )。 例 如 ， 调 用 


integerToString(42, 16) 
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应 该 返回 字符 串 "2A"， 同 样 地 ， 调 用 

stringToInteger("111111", 2) 

将 会 返回 整数 63。 你 的 函数 应 能 处 理 负数 ， 并 且 当 stringToInteger 的 第 一 个 参数 对 于 一 个 特 
定 的 基数 来 说 越界 时 应 能 够 报错 。 


. 重 写 第 6 章 习 题 11 的 表达 式 计算 器 ， 使 其 输入 输出 值 均 能 用 十 六 进 制 表示 。 下 面 是 该 程序 一 个 运行 
示例 : 


A 








在 编写 该 程序 时 ， 最 简单 的 方法 是 将 表达 式 按 字 处 理 而 不 是 按 数 据 处 理 ， 然 后 调用 你 在 习题 3 rn i 
写 的 函数 来 实现 该 转换 。 

, 重 写 图 2-3 所 示 的 Quadratic 程序 ， 使 其 使 用 明确 的 指针 而 不 是 引用 调用 来 得 到 也 数 get- 
Coefficients 和 solveQuadratic 的 返回 值 。 

6. 使 用 MAX_JUDGES 的 定义 ， 并且 将 11.3.4 节 中 的 scores 作为 一 个 初始 指针 ， 编 写 一 个 程序 读 取 
裁判 的 分 数 (0 到 10 )， 然 后 去 掉 最 高 分 和 最 低 分 计算 其 平均 值 。 你 的 程序 应 该 能 不 断 接受 输入 ， 
直到 达到 裁判 给 的 最 高 分 ， 或 者 有 用 户 输入 一 个 空格 来 终止 程序 。 该 程序 的 一 个 运行 示例 如 下 图 
所 示 : 


Un 









í i km T” rs eg tæ qu oo ee 
‘Enter a score for each judge in the range 0 to 10. 
|Enter a blank line to signal the end of the list. 


| Judge #1: 9.0 

| Judge 42: 9.1 

| Judge #3: 9.3 

| Judge #4: 9.0 

| Judge #5: 8.8 
Judge #6: 9.0 

Judge #7: * 
The average after eliminating 8.80 and 9.30 is 9.03. 

m nin " “ae 


ESA 10-3 所 示 的 归并 排序 算法 的 实现 ， 使 其 对 一 个 数组 而 不 是 矢量 进行 排序 。 正 如 在 11.3.5 节 中 
所 示 的 选择 排序 算法 的 实现 ， 你 的 函数 原型 如 下 : 


void sort(int array[], int n) 


8. 尽管 在 C++ 语言 中 复制 流 对 象 是 不 合法 的 ， 但 是 你 可 以 在 数据 结构 中 存储 一 个 指向 一 个 流 的 指针 。 
例如 ， 可 以 如 下 所 示 实 现 此 方法 : 


void setInput (istream & infile) 


该 方法 在 6.4 节 的 TokenScanner 类 中 介绍 过 。 你 所 要 做 的 就 是 以 指针 变量 存储 infile 的 地 址 ， 
然后 解析 这 个 指针 从 流 中 读 取 值 。 
扩展 图 6-10 和 图 6-11 所 示 的 简化 TokenScanner 类 ， 使 其 能 够 读 取 输 入 流 中 的 记号 及 字符 
514 BBE. 
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Programming Abstractions in C++ 


动态 内 存 管理 


爆炸 的 系统 和 无 用 的 命名 会 导致 你 的 存储 过 载 。 
一 一 玛丽 . X, (HHH mg )Frankenstein), 1818 


截至 目前 ， 你 已 经 接触 过 两 种 为 变量 分 配 内 存 的 机 制 。 当 你 声明 一 个 全 局 常量 或 变量 ， 
编译 器 会 给 这 个 全 局 常量 在 整个 程序 生命 周期 内 分 配 一 块 持久 的 内 存 空间 。 这 种 分 配 模 式 被 
称 为 静态 分 配 〈 static allocation)， 因 为 变量 在 整个 程序 生命 周期 被 分 配 到 固定 的 内 存 地 址 。 
另 一 种 是 当 你 在 一 个 函数 内 声明 一 个 局 部 变量 时 ， 该 变量 的 存储 空间 被 分 配 在 栈 中 。 在 调用 
这 个 函数 时 ， 将 为 该 变量 分 配 存储 空间 ; 当 函 数 返回 时 ， 该 变量 所 占用 的 存储 空间 就 会 被 自 
动 释放 。 这 种 内 存 分 配 模 式 被 称 为 自动 分 配 ( automatic allocation )。 然 而 ， 还 有 第 三 种 内 存 
分 配方 式 ， 即 当 程 序 运行 时 ， 人 允许 你 获得 新 的 内 存 空 间 。 这 种 模式 叫做 动态 分 配 (dynamical 
location ) 。 

动态 分 配 是 你 可 以 自 认 为 精通 C++ 之 前 必须 掌握 的 最 重要 的 技巧 之 一 。 部 分 原因 是 动 
态 分 配 内 存 允 许 在 程序 运行 时 扩展 所 需 的 数据 结构 。 例 如 在 第 S 章 介绍 过 的 集合 类 就 依赖 于 
这 一 能 力 。 当 然 对 于 Vector 或 者 Map 的 大 小 并 没有 什么 限制 。 如 果 这 些 类 需要 更 多 的 内 
存 ， 它 们 只 需要 直接 向 系统 申请 。 

ECH H, 动态 分 配 内 存 特别 重要 ， 因 为 C++ 与 大 多 数 现代 语言 相 比 ， 赋 予 了 编程 
者 更 多 的 职责 。 在 C++ 中， 知道 如 何 分 配 内 存 是 不 够 的 ， 你 还 必须 学 习 当 不 再 需要 这 块 
内 存 空间 时 应 如 何 释放 它 。 按 照 一 定 原则 分 配 和 释放 内 存 的 过 程 被 称 为 内 存 管理 ( memory 


management), 


12.1 动态 分 配 和 堆 


当 程 序 加 载 到 内 存 时 ， 通 常 只 会 占用 可 用 存储 空间 的 一 小 部 分 ， 和 大 部 分 编程 语言 一 
样 ， 无 论 你 的 应 用 什么 时 候 需 要 更 多 的 内 存 , C++ 都 允许 你 给 程序 分 配 一 些 闲置 的 存储 空间 。 
例如 ， 如 果 在 程序 运行 时 需要 给 一 个 数组 分 配 空间 ， 你 可 以 保留 一 部 分 未 分 配 的 内 存 ， 留 下 
剩余 部 分 给 随后 的 分 配 行为 。 程 序 中 一 组 未 分 配 的 可 用 内 存 池 被 称 为 堆 (heap). 

在 现代 计算 机 体系 结构 中 ， 整 个 内 存 空 间 被 设置 为 栈 和 堆 ， 它 们 以 相反 的 方向 增长 ， 如 


下 图 所 示 : 
X HB 
向 更 高 地 址 增长 向 更 低地 址 增长 


这 种 策略 的 优点 在 于 任 一 区 域 都 可 以 依照 需要 增长 ， 直 到 所 有 可 用 内 存 填 满 为 止 。 

当 你 需要 内 存 时 ， 从 堆 中 分 配 内 存 的 能 力 是 已 被 普遍 应 用 于 编程 的 一 种 非常 有 效 的 方 
法 。 例 如 ， 所 有 的 集合 类 用 堆 存储 它们 的 元 素 ， 因 为 动态 分 配对 于 构建 数据 结构 ， 使 其 依照 
需求 扩展 来 说 是 必 不 可 少 的 。 在 这 一 章 的 后 面 ， 你 会 有 机 会 搭建 一 个 简易 集合 类 版 本 。 然 
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而 ， 在 此 之 前 ， 学 习 动态 分 配 的 基本 机 制 并 了 解 其 过 程 如 何 进行 是 非常 重要 的 。 


12.1.1. new 操作 符 
C++ 使 用 new 操作 符 从 堆 中 分 配 内 存 。new 操作 符 最 简单 的 一 种 形式 是 : 取 一 种 类 型 ， 
并 在 堆 中 分 配 一 块 空间 给 所 指定 类 型 的 变量 。 例 如 ， 如 果 你 想 在 堆 中 分 配 整 型 量 的 内 存 空 
间 ， 你 可 以 调用 : 
int *ip = new int; 
这 个 new PEPE FE AY Dal FIER [n] Te ME H EL £t gi E83 Hb Foe fe htc C S fe E HE. RE 
中 第 一 个 空闲 的 字 位 于 地 址 1000， 当 前 栈 帧 中 的 变量 ip 会 被 赋予 这 个 地 址 空间 ， 如 下 图 


所 示 : 
从 概念 上 来 说 ， 栈 帧 中 的 局 部 变量 ip 指向 新 分 配 的 堆 空间 。 为 清楚 起 见 ， 你 可 用 箭头 代替 
地 址 来 表示 这 种 关系 ， 如 下 图 所 示 : 
地 址 空间 的 内 容 未 变 ， 唯 一 变化 的 就 是 你 如 何 去 画 这 个 图 。 

一 旦 你 在 堆 中 为 整 型 数 分 配 了 空间 ， 那 么 你 可 以 通过 解析 指针 来 引用 该 整数 。 例 如 ， 通 
过 执行 下 述 语句 将 整数 42 存储 在 新 分 配 的 字 中 : 

*ip = 42; 
这 将 使 内 存 如 下 发 生变 化 : 

amm EI, 

12.1.2 动态 数组 

new 操作 符 也 能 做 到 在 堆 上 给 一 个 数组 分 配 空间 ， 它 被 称 为 动态 数组 ( dynamic array). 
为 一 个 动态 数组 分 配 空间 ， 你 要 在 类 型 名 之 后 跟 一 对 方 括号 ， 并 在 其 中 指明 要 求 所 分 配 的 元 
素数 目 。 因 此 ， 声 明 语 句 : 

double *array = new double[3]; 


初始 化 数组 array， 以 便于 其 指向 连续 的 足够 大 的 一 块 内 存 来 存储 三 个 double 类 型 的 变 
量 ， 如 下 图 所 示 : 


array 


变量 array 现在 是 一 个 全 功能 的 数组 ， 它 的 存储 现在 位 于 堆 而 不 是 栈 。 你 可 以 给 数组 array 
的 每 一 个 元 素 赋值 ， 接 着 这 些 元 素 会 被 存储 在 堆 上 合适 的 内 存 位 置 。 
尽管 动态 数组 在 大 量 数据 结构 的 底层 实现 中 很 有 用 ， 但 在 大 多 数 应 用 中 却 很 少 使 用 。 第 
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5 章 中 介绍 过 的 Vector 类 在 实际 应 用 中 是 一 个 更 好 的 选择 ， 主 要 是 因为 Vector 类 执行 自 
己 的 内 存 管理 ， 从 而 减轻 你 的 责任 。 
12.1.3 AMR 

new 操作 符 也 用 于 在 堆 上 分 配对 象 和 结构 体 。 如 果 你 仅 提供 类 名 ， 就 像 如 下 语句 : 


Rational *rp = new Rational; 


C++ 在 堆 中 为 Rational 对 象 分 配 空间 ， 并 调用 默认 构造 函数 ， 在 内 存 中 构造 出 以 下 情形 : 





如 果 你 在 类 型 名 后 提供 了 参数 ，C++ 会 调用 对 应 的 构造 函数 。 以 下 声明 : 


Rational *rp = new Rational(2, 3); 


因而 创建 了 以 下 内 存 状态 : 





12.2 ”链表 


指针 能 够 在 一 个 大 型 数据 结构 中 记录 不 同 值 之 间 的 联系 。 当 一 个 数据 结构 包含 了 男 一 
个 数据 结构 的 地 址 时 ， 这 种 结构 关系 被 称 为 链接 (link)。 在 接 下 来 的 章节 ， 你 会 看 到 更 多 的 
有 关 链 接 结 构 的 例子 。 为 了 让 你 对 即将 展现 的 链接 的 吸引 力 有 一 个 预览 ， 同 时 为 了 提供 更 多 
在 堆 中 对 结构 使 用 指针 的 例子 ， 这 一 节 接 下 来 会 介绍 被 称 为 链表 (linked list) 的 基本 数据 结 
构 ， 在 一 个 线性 链表 中 ， 指 针 将 一 个 个 数据 值 像 一 个 链 一 样 连接 起 来 。 


12.2.1 刚 铎 灯塔 


我 最 喜欢 的 链表 的 例子 是 从 下 面 这 一 段 由 JR.R. 托 尔 金 所 著 的 《王者 归来 》 的 文章 中 获 

取 的 灵感 : 
甘 道 夫 大 声 地 向 它 的 马 岂 喊 道 :“ 快 ,幻影 ! 我 们 必须 加 速 。 时 间 很 紧 迪 。 看 ! 

刚 铎 的 灯塔 已 经 点 亮 ， 寻 求 帮 助 。 战 争 已 经 爆发 。 看 ， 阿 蒙 丁 峰 已 经 燃 起 了 火焰 ， 

伊 莱 纳 替 山 也 已 泛 红 ， 火 焰 正 在 向 西 蔓延 : 纳 多 尔 、 艾 瑞 斯 、 明 - 里 蒙 卡 兰 哈 德 、 

洛 汗 的 边界 哈 利 费力 安 。” 

改编 《指环 王 》 三 部 曲 的 这 一 段 情 节 时 ,彼得 "杰克逊 为 这 一 场景 创作 了 一 个 启发 性 
的 解释 。 在 米 那 斯 提 力 斯 的 第 一 座 灯 塔 点 亮 之 后 ， 我 们 看 到 信和 号 在 每 个 灯塔 的 看 守 人 的 操作 
下 ， 从 一 个 山顶 传递 到 另 一 个 山顶 ， 看 守 者 总 是 十 分 警惕 ， 只 有 看 到 前 一 站 的 灯火 被 点 亮 才 
会 点 燃 他 们 自己 的 灯火 。 刚 铎 的 险情 因此 迅速 地 在 洛 汗 众多 被 分 离 的 联盟 国之 间 传 递 ， 如 
图 12-1 所 示 。 

为 了 使 用 C++ 来 模拟 刚 铎 灯塔 这 一 情景 ， 你 需要 定义 一 个 结构 类 型 来 表示 链 中 的 每 一 
座 灯 塔 。 这 个 结构 必须 包含 每 一 座 灯 塔 的 名 字 以 及 链 中 指向 下 一 座 灯 塔 的 指针 。 因 此 ， 这 个 
表示 米 那 斯 提 力 斯 的 结构 包含 一 个 指向 Amon Din 的 指针 ， 而 它 按 顺序 又 包含 一 个 Eilenach 
结构 的 指针 ， 等 等 ， 直 到 指向 一 个 标志 着 这 条 链 结束 的 空 指针 为 止 。 
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4.7 4 ToT oll 


Minas Tirith Amon Din Eilenach Nardol Erelas Min-Rimmon Calenhad Halifirien Rohan 


图 12-1 托 尔 金刚 铎 灯塔 的 语义 图 
如 果 你 采用 这 种 方法 ， 灯 塔 Tower 的 结构 定义 就 如 下 所 示 : 


struct Tower ( 
string name; 
Tower *link; 
b 
name 域 记 录 了 灯塔 的 名 字 ，1Link 域 指向 链 中 下 一 个 信号 灯塔 。 图 12-2 阐明 了 这 些 结构 的 内 
存 表示 法 。 每 一 个 独立 的 Tower 结构 代表 了 链表 中 的 一 个 结 点 ， 其 内 部 的 指针 叫做 链接 。 结 
点 可 能 出 现在 内 存 的 任何 地 方 ; 其 顺序 是 由 每 一 个 结 点 链接 其 后 继 单元 的 链接 所 决定 的 。 















Minas Tirith 


me 
图 12-2 链表 表示 刚 铎 灯塔 


图 12-3 中 的 程序 模拟 了 刚 铎 灯塔 的 点 亮 过 程 。 该 程序 以 调用 createBaeconsOfGondor 
函数 开始 ， 它 构建 该 链表 并 返回 指向 链表 中 第 一 座 灯 塔 的 指针 。 每 一 座 灯 塔 都 是 由 
createTower 因数 创建 ， 它 为 新 的 Towez 值 分 配 空 间 ， 然 后 通过 参数 传人 其 name 和 
link 域 值 。createBeacons0fGondor 的 实现 逆序 构建 链表 ， 即 首先 在 链表 的 尾部 创 
建 了 第 一 个 灯塔 Rohan， 然 后 继续 向 前 ， 一 次 一 座 灯 塔 ， 直 到 它 到 达 链 表 的 开始 处 Minas 
Tirith 为 止 。 在 一 个 更 通用 的 应 用 中 ， 更 倾向 于 从 数据 文件 中 读 取 每 一 个 存储 单元 的 值 ， 你 
在 习题 3 中 会 有 机 会 扩展 这 个 实现 。 


/* 
* File: BeaconsOfGondor.cpp 
* 


* This program illustrates the concept of a linked list by simulating the 
* Beacons cf Gondor story from J. R. R. Tolkien's Return of the King. 
Ry 
#include <iostream> 
#include <string> 
using namespace std; 
/* 
* Type: Tower 
* 
* This structure contains the name of the tower and a link to the next one. 
s/f/ 
struct Tower { 
string name; /* The name of this tower */ 
Tower *link; /* Pointer to the next tower in the chain */ 


}; 


/* Function prototypes */ 





图 12-3 刚 铎 灯塔 的 仿真 程序 
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Tower *createBeaconsOfGondor () ; 
Tower *createTower(string name, Tower *link) ; 
void signal(Tower *start); 


/* Main program */ 


int main() ( 
Tower *list = createBeaconsOfGondor(); 
signal (list); 
return 0; 


Function: createBeaconsOfGondor 
Usage: Tower *list = createBeaconsOfGondor () ; 


Creates a linked list of the towers described by Tolkien. The function 
builds the list backwards and returns a pointer to the first tower. 


"~ 


Tower *createBeaconsOfGondor() { 
Tower *tp - createTower("Rohan", NULL); 
- createTower("Halifirien", tp); 
- createTower("Calenhad", tp); 
- createTower("Min-Rimmon", tp); 
- createTower("Erelas", tp); 
= createTower("Nardol", tp); 
= createTower("Eilenach", tp); 
= createTower ("Amon Din", tp); 
return createTower("Minas Tirith", tp); 


* Function: createTower 
Usage: Tower *chain = createTower(name, link); 


Creates a new Tower structure with the specified components. 
*/ 


Tower *createTower(string name, Tower *link) ( 
Tower *tp - new Tower; 
tp->name = name; 
tp->link = link; 
return tp; 


Function: signal 
Usage: signal (start); 


Generates a signal starting at the current tower. and proceeding 
through the end of the chain. 


void signal (Tower *start) { 
for (Tower *tp = start; tp != NULL; tp = tp-»link) { 
cout << “Lighting " << tp->name << endl; 
} 





图 12-3 (4%) 


这 个 链表 被 初始 化 之 后 ， 主 程序 调用 signal 函数 显示 出 灯塔 的 名 字 。 如 果 按 照 
图 12-2 所 示 的 链表 开始 ， 程 序 的 输出 结果 如 下 : 










Ix 





Lighting Minas Tirith 
Lighting Amon Din 
Lighting Eilenach 
Lighting Nardol 
Lighting Erelas 
Lighting Min-Rimmon 
Lighting Calenhad 

| Lighting Halifirien 
Lighting Rohan 
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FS 3x A1 Z5 A AS GE E] I T CERE Hr rp I SO A CS A S, 但 你 可 以 扩展 这 个 
BeaconsOfGondor 程序 ， 以 便 它 使 用 图 形 库 展示 出 这 条 链 上 灯塔 之 间 的 烽火 传递 。 


12.2.2 ”链表 内 的 迭代 

signal 这 段 代 码 表明 了 关于 链表 的 一 个 基本 编程 模式 ， 其 具体 表现 在 for 循环 : 

for (Tower *tp = start; tp !- NULL; tp = tp->link) 
在 signal 函数 体 中 , for 循环 模式 的 效果 与 经 典 的 for 循环 遍历 数组 中 的 每 一 个 元 素 一 样 ， 
这 个 循环 也 是 遍历 链表 中 的 每 一 个 元 素 。 初 始 化 表达 式 声 明了 指针 变量 tp， 并 将 其 初始 化 ， 
以 便 它 指 向 链表 中 第 一 个 元 素 的 指针 。 条 件 表 达 式 确保 了 只 要 tp 变量 不 为 空 ， 即 它 的 值 若 
没有 指向 链表 的 末尾 ， 循 环 就 会 继续 。for 循环 中 的 步 长 表达 式 为 : 

tp = tp-»link; 


这 改变 了 tp 的 值 ， 从 而 改变 了 当前 Tower 结构 的 link 指针 的 值 ， 使 tp 指向 链表 中 的 下 
一 座 灯 塔 。 


12.2.3 ”递归 和 列表 


尽管 用 来 处 理 链 表 的 大 多 数 代码 都 如 之 前 小 节 所 描述 的 迭代 方式 进行 ， 但 链表 的 递归 特 
性 在 实际 中 很 有 用 。 简 单 情 况 就 是 它 为 空 列表 (empty list), Æ C+ H, MEHE NULL 表 
示 。 一 般 情 况 下 ， 一 个 链表 由 一 个 数据 单元 后 跟 一 个 链表 构成 。 这 种 形式 导致 了 自然 的 递归 
分 解 ， 在 你 第 一 次 检查 链表 是 否 为 空 时 ， 如 果 不 为 空 ， 在 第 一 个 存储 单元 上 执行 一 些 操作 ， 
用 该 链表 的 剩余 子 链表 作 参 数 递归 地 进行 调用 。 例 如 ， 你 可 以 像 下 段 代 码 一 样 递归 地 实现 
signal KK: 
void signal(Tower *start) { 
if (start !- NULL) ( 
cout << "Lighting " << start->name << endl; 
signal (start->link) ; 


} 
} 


12.3 BRAG 

尽管 计算 机 的 内 存 一 直 在 增 大 ， 但 它 总 是 有 限 的 。 因 此 ， 堆 空间 最 终 会 被 耗 尽 。 当 这 种 
情况 发 生 时 ，new 操作 符 将 不 能 分 配 所 需要 的 内 存 空间 。 对 分 配 内 存 空 间 的 请 求 失效 是 非常 
严重 的 错误 ， 以 致 通常 程序 没有 任何 办 法 将 其 恢复 。 


12.3.1 delete 操作 符 


为 了 确保 你 的 内 存 不 会 被 耗 尽 ， 更 好 的 策略 是 每 当 你 使 用 完 堆 空间 后 便 释 放 它 。 为 了 实 
现 此 策略 ，C++ 提供 了 delete 操作 符 ， 它 取 new 操作 符 事先 分 配 内 存 的 一 个 指针 ， 然 后 
释放 由 该 指针 所 指 的 内 存 空间 。 

例如 ,假定 你 已 经 声明 了 一 个 如 下 所 示 指 向 int 型 的 指针 : 


int *ip = new int; 


在 程序 的 后 面 ， 你 发 现 不 再 需要 这 个 指针 变量 所 指 的 空间 。 此 时 ， 该 做 的 事情 就 是 通过 调用 
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以 下 语句 释放 该 指针 变量 所 指 的 空间 : 
delete ip; 


如 果 堆 内 存 是 一 个 数组 ， 你 需要 在 delete 关键 字 后 面 加 上 一 对 方 括号 。 因 此 ， 如 果 通 过 
以 下 语句 : 

double *array = new double[3]; 
分 配 了 一 个 动态 数组 ， 你 可 以 通过 执行 以 下 语句 来 释放 已 分 配 的 那 块 内 存 : 


delete[] array; 


如 果 和 你 需要 释放 一 个 链表 ， 那 你 必须 对 每 一 个 存储 单元 进行 迭代 ， 释 放 你 所 涉及 的 每 
一 个 单元 的 空间 。 然 而 ， 你 这 样 做 需要 多 加 小 心 ， 因 为 你 不 能 在 释放 一 个 对 象 后 再 访问 它 的 
link 域 。 因 此 ， 在 你 释放 指针 当前 所 指 的 存储 单元 之 前 ， 你 的 循环 结构 必须 存储 指向 下 一 
个 存储 单元 的 指针 ， 就 像 下 面 while 循环 那样 : 
while (list != null) { 
Tower *next = list->link; 
delete list; 


list = next; 


} 
如 果 你 使 用 下 面 的 递归 算法 ， 那么 删除 链表 中 的 每 一 个 指针 就 相对 简单 了 : 


void freeList(Tower *list) ( 
if (list !- NULL) ( 
freeList(list-»link); 
delete list; 
) 
) 


12.3.2 ”释放 内 存 策 略 


知道 何 时 释放 一 块 内 存 并 不 容易 ， 尤 其 是 当 程 序 比较 大 时 。 如 果 程 序 的 某 些 部 分 共享 一 
些 已 经 在 堆 中 被 分 配 的 数据 结构 ， 或 许 就 不 太 可 能 辨别 任 一 部 分 的 内 存 是 否 需要 。 对 于 简单 
的 程序 ， 一 直 运行 直 到 产生 预期 的 结果 ， 你 可 以 分 配 你 想 要 的 内 存 ， 不 用 为 再 次 释放 它 而 烦 
恼 ， 这 也 不 失 为 一 个 合理 的 策略 。 然 而 这 样 做 很 可 能 使 你 养 成 一 个 危险 的 习惯 。 如 果 另 一 个 
程序 员 试 图 在 长 时 间 运 行 的 应 用 中 使 用 你 的 代码 ， 那 么 你 对 内 存 的 忽视 会 导致 一 个 严重 的 问 
题 。 因 此 好 的 做 法 就 是 确保 在 某 一 时 刻 释 放 你 所 分 配 的 堆 内 存 。 当 一 个 程序 未 能 释放 它 不 用 
的 堆 内 存 时 ， 这 个 程序 就 被 称 为 存在 内 存 泄漏 (memory leak). 

某 些 编程 语言 ， 包 括 带 有 大 量 脚 本 语言 的 Java 语言 ， 支 持 一 种 动态 分 配 的 策略 ， 它 会 
自动 查找 不 再 使 用 的 内 存 ， 然 后 释放 之 。 这 种 策略 被 称 为 垃圾 回收 (garbage collection)。 尽 
管 垃 圾 回收 增加 了 一 些 开 销 ， 但 它 也 使 得 程序 员 对 于 内 存 的 管理 非常 简单 。 快 速 查 找 整 个 
堆 , 计 算出 堆 中 哪些 部 分 正在 使 用 是 需要 时 间 开 销 的 。 更 糟糕 的 是 ， 垃 圾 回收 经 常 使 我 们 难 
以 预测 执行 一 个 特定 任务 所 用 的 时 间 。 如 果 一 个 特定 的 函数 调用 被 垃圾 回收 的 运行 所 中 断 ， 
这 通常 会 使 得 运行 很 快 的 函数 可 能 会 突然 需要 大 量 的 运行 时 间 。 如 果 这 个 函数 负责 某 些 实时 
任务 ， 则 该 应 用 可 能 就 不 能 满足 其 响应 时 间 。 

然而 ， 大 多 数 新 的 编程 语言 还 是 采用 垃圾 回收 作为 它们 的 内 存 管 理 策略 。 作 为 一 个 普遍 
原理 ， 用 牺牲 一 小 部 分 处 理 时 间 来 换取 大 量 的 编程 时 间 是 值得 的 。 毕 竟 处 理 器 便宜 ， 而 程序 
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员 的 代价 高 。 然 而 ， 由 于 C++ 起源 于 较 早 的 年 代 。 无 论 如 何 ，C++ 的 设计 者 还 是 决定 将 释 
放 堆 内 存 的 职责 交 到 程序 员 的 手中 ， 而 不 是 将 这 个 任务 托付 给 程序 自动 处 理 。 l 

幸运 的 是 ， 设 计 者 们 通过 给 程序 员 提 供 一 种 与 众 不 同 的 内 存 管 理 策略 极 大 地 简化 了 这 个 
问题 ， 用 以 弥补 垃圾 回收 的 不 足 。 在 C++ 中 ,每 一 个 类 都 允许 指定 它 的 一 个 对 象 消失 时 会 
发 生 什么 。 在 良好 设计 的 C++ 应 用 中 ， 每 个 类 都 要 对 它 自 己 的 堆 内 存 负责 ， 从 而 把 用 户 需 
要 准确 地 记忆 当前 哪些 堆 是 活动 的 这 一 几乎 不 可 能 的 任务 中 解放 了 出 来 。 学 习 有 效 地 使 用 这 
个 策略 是 你 作为 一 个 C++ 程序 员 必须 掌握 的 重要 技能 之 一 ， 因 此 ， 在 下 节 详 细 地 讲述 该 方 
法 的 细节 上 多 花 点 心思 是 很 值得 的 。 


12.3.3 Wit 


就 像 你 已 经 看 过 的 例子 那样 ，C++ 类 典型 地 定义 了 一 个 或 多 个 用 来 初始 化 对 象 的 构造 函 
数 。 每 一 个 类 也 可 以 定义 一 个 析 构 函数 ( destructor)， 当 一 个 类 的 对 象 消亡 时 ， 析 构 函 数 被 
自动 调用 。 这 个 析 构 函数 可 以 完成 各 种 清理 操作 。 例 如 ， 它 可 以 关闭 一 个 对 象 打开 的 任何 文 
件 。 然 而 ， 析 构 函 数 最 重要 的 一 个 作用 是 释放 对 象 所 创建 的 所 有 堆 内 存 。 

在 C++ 中， 析 构 函数 的 名 字 就 是 简单 地 在 类 名 前 加 一 个 被 称 为 波浪 符 (titled) 的 ~ 符 
号 。 因 此 ， 如 果 你 需要 为 一 个 叫做 MyClass 的 类 定义 一 个 析 构 函数 ， 其 接口 原型 应 如 下 
TAS : 


^MyClass(); 


和 构造 函数 一 样 ， 析 构 函 数 没有 返回 类 型 。 和 构造 函数 不 同 的 是 析 构 函数 不 能 重 载 。 每 一 个 
类 只 能 有 一 个 无 参 的 析 构 函数 。 

在 C++ 中 ， 对 象 会 以 几 种 不 同 的 方式 消失 。 大 多 数 情况 下 ， 对 象 会 像 函 数 体 中 的 局 部 
变量 那样 被 声明 ， 意 味 着 它 被 分 配 到 栈 中 。 这 些 对 象 在 函数 返回 时 自动 消亡 。 这 也 就 意味 着 
它们 的 析 构 函数 同时 被 自动 调用 ， 这 恰恰 为 类 定义 释放 在 其 对 象 生 命 周 期 所 分 配 的 堆 内 存 提 
供 了 机 会 。 大 多 数 C++ 文档 中 ， 将 一 个 函数 返回 时 其 局 部 变量 消亡 的 现象 称 为 超出 范围 (go 
out of scope). 

当 计 算 表 达 式 时 ， 即 使 它们 的 值 不 会 存储 在 局 部 变量 中 ， 对 象 也 可 以 作为 临时 变量 被 创 
建 。 例 如 ,第 6 MA Rational 类 中 的 测试 程序 包含 了 以 下 代码 : 

Rational a(1, 2); 

Rational b(1, 3); 


Rational c(1, 6); 
Rational sum = a + b + c; 


当 函 数 返 回 时 ， 局 部 变量 a、b、c 和 sum 将 会 销毁 。 然 而 ， 上 述 最 后 一 行 代码 在 计算 最 终 
结果 之 前 ， 会 将 表达 式 a+b+c 的 值 作为 Rational 类 型 的 临时 对 象 而 暂 存 。 一 旦 该 表达 式 
的 值 赋 给 了 对 象 sum， 则 上 述 临 时 对 象 就 会 超出 作用 域 范围 。 如 果 Rational 类 有 一 个 析 
构 函 数 ， 此 时 系统 就 会 自动 调用 其 析 构 函数 来 释放 该 临时 对 象 所 占用 的 内 存 。 


12.4 FEM CharStack 类 


为 了 对 如 何 编写 一 个 使 用 动态 内 存 分 配 的 类 有 更 深入 的 认识 ， 一 个 最 简单 的 方法 是 实现 
第 5 章 的 某 个 容器 类 。 最 易于 实现 的 容器 类 就 是 Stack 类 ， 主 要 原因 在 于 它 只 有 几 个 公有 
方法 。 然 而 ， 为 了 使 该 实现 更 简单 ， 有 必要 约束 该 栈 中 的 元 素 类 型 ( 基 类 型 ) 均 为 同一 种 数 
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据 类 型 一 一 这 种 情况 下 ， 元 素 类 型 为 字符 的 栈 会 在 第 13 章 看 到 是 非常 有 用 的 。 当 你 学 完了 
第 14 章 介绍 的 模板 机 制 后 ， 你 就 有 机 会 去 编写 一 个 多 态 版 本 的 Stack 类 。 现 在 ， 你 的 目标 
是 了 解 像 Stack 类 是 如 何 采用 动态 分 配 来 管理 内 存 的 。 为 此 ， 这 个 栈 的 基 类 型 并 不 重要 ， 
字符 栈 将 足以 阐明 动态 内 存 分 配 的 一 些 通用 原理 。 


12.4.4 charstack.hj£[l 


图 12-4 所 示 的 是 接口 charstack.h 的 内 容 。 这 个 接口 对 外 提供 了 包括 默认 构造 函数 、 
析 构 函数 和 各 种 方法 ， 即 size, isEmpty, clear, push, pop 和 peek 方 法 ， 它 们 定 
义 了 栈 的 抽象 行为 。 唯 一 不 同 于 上 述 方法 行为 的 是 其 析 构 函数 ， 它 的 原型 如 下 : 


~CharStack (); 


CharStack 类 的 析 构 函数 永远 也 不 会 被 明确 地 调用 。 在 接口 中 出 现 的 这 一 函数 原型 只 是 让 
编译 器 知道 CharStack 类 中 定义 了 一 个 只 要 charstack 的 对 象 超出 作用 域 范围 就 需要 
调用 的 析 构 函数 。 该 析 构 函 数 负责 释放 该 类 中 已 分 配 的 堆 空间 ， 并 对 用 户 隐 藏 了 内 存 管理 
细节 。 

如 果 你 读 完了 图 12-4 所 示 的 代码 ， 你 将 发 现 CharStack 类 的 程序 清单 中 没有 出 现 其 
私有 部 分 内 容 。 该 私有 部 分 的 位 置 处 于 一 个 稍 后 会 被 填充 的 盒 中 。 从 概念 上 来 说 ， 一 个 类 的 
私有 部 分 并 不 是 公有 接口 的 一 部 分 。 遗 憾 的 是 ，C++ 的 语法 规则 要 求 私 有 部 分 要 在 类 的 内 部 
定义 。 任 何 私有 部 分 的 执行 代码 要 在 .cpp 文件 中 重 写 , 但 是 对 于 这 些 方 法 的 原型 和 实例 变 
量 的 声明 必须 包含 在 .h 文件 中 。 当 你 作为 一 个 用 户 使 用 类 时 ， 你 应 该 养 成 一 个 习惯 ， 即 忽 
视 私 有 部 分 的 细节 。 这 些 细 节 只 有 在 理解 了 类 的 公有 特性 后 才 可 能 了 解 。 本 书 中 忽略 了 私有 
部 分 的 接口 清单 ， 使 隐藏 这 些 细 节 更 加 简单 。 


/* 
* File: charstack.h 
* 


* This interface defines the CharStack class, which implements 


* the stack abstraction for characters. 


*/ 


#ifndef  charstack h 
#define _charstack_h 


* This class models a stack of characters. The fundamental operations 
* are the same as those for the Stack<char> class. 
my 

class CharStack ( 

public: 

/* 


* Constructor: CharStack 
* Usage: CharStack cstk; 


* Initializes a new empty stack that can contain characters. 
* 


CharStack(); 


/* 
* Destructor: ~CharStack 
* Usage: (usually implicit) 





图 12-4 CharStack 类 基于 数组 的 接口 
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* Frees any heap storage associated with this character stack. 


*/ 
^CharStack(); 
/* 
* Method: size 
* Usage: int nElems cstk.size(); 


* Returns the number of characters in this stack. 


Ay 


int size(); 


Method: isEmpty 
Usage: if (cstk.isEmpty()) 


Returns true if this stack contains no characters. 


*/ 
bool isEmpty(); 


Method: clear 
Usage: cstk.clear(); 


void clear(); 


Method: push 
Usage: cstk.push(ch); 


Pushes the character ch onto this stack. 
+s 


void push (char ch); 


Method: pop 
Usage: char ch cstk.pop(); 


Removes the top character from this stack and returns it. 
Az 
char pop(); 
/* 
* Method: peek 


* Usage: char ch = cstk.peek(); 
* 


* Returns the value of the top character from this stack without 
* removing it. Raises an error if called on an empty stack. 


e 


char peek(); 


The private section of the class goes here. i 





E 12-4 (4) 


然而 ， 在 类 接口 清单 中 忽略 私有 部 分 的 细节 还 有 另 一 个 重要 原因 。 之 后 几 章 我 们 主要 关 
注 类 在 效率 和 实现 策略 之 间 的 关系 上 。 清 楚 地 理解 这 种 关系 要 求 能 够 比较 同一 个 类 的 多 种 实 
现 。 即 使 这 些 实现 使 用 不 同 的 数据 结构 ， 类 的 公有 部 分 仍 完 全 一 致 。 在 接 下 来 的 几 节 ， 你 会 
有 机 会 探索 字符 栈 类 的 几 种 可 能 的 实现 ， 每 一 种 实现 都 需要 你 用 不 同 并 且 合适 的 代码 块 代替 
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图 12-4 中 的 盒子 。 


12.4.2 ”选择 字符 栈 的 表示 


当 你 打算 为 一 个 类 设计 其 基础 的 数据 结构 时 ， 你 应 该 询问 你 自己 的 第 一 个 问题 就 是 : 该 
类 的 每 个 对 象 中 都 需要 存储 什么 信息 。 一 个 字符 栈 必须 记录 字符 进 栈 的 次 序 。 对 于 任何 集合 
类 ， 没 有 理由 对 栈 可 以 包含 任意 的 字符 数目 加 以 限制 。 因 此 ， 作 为 一 个 实现 者 ， 你 需要 为 其 
选择 一 个 可 以 在 程序 运行 时 动态 扩展 的 数据 结构 。 

当 你 思考 这 样 的 数据 结构 应 该 是 什么 样子 时 ， 你 的 一 个 想法 可 能 是 采用 Vector«char» 
去 存储 栈 中 的 元 素 。Vector 可 以 动态 变化 ， 这 正 是 你 在 这 个 应 用 中 所 需要 的 。 事 实 上 ， 采 
用 Vector<char> 作为 类 的 基本 表示 会 使 得 其 实现 极其 简单 ， 正 如 以 下 的 图 12-5 和 图 12-6 
所 示 。 


Private section */ 


Implementation notes 


This version of the CharStack class uses a Vector<char> as its 
underlying representation. Characters are always added and 
removed from the end, which gives rise to the last-in/first-out 
behavior that is characteristic of stacks. 


/* Instance variables */ 


Vector«char» elements; /* Data structure to hold the stack elements */ 


}; 





图 12-5 使 用 Vector 作为 CharStack 类 的 私有 部 分 


File: charstack.cpp 


This file implements the CharStack class using a Vector<char> as the 
underlying representation. The Vector class already implements most 
of the essential operations for the CharStack class, which can simply 
forward the request to the underlying structure. The methods are 
short enough to require no detailed documentation. 


#include "charstack.h" 
#include "error.h" 
#include "vector.h" 
using namespace std; 


CharStack::CharStack() ( 
/* Empty */ 
} 


CharStack::~CharStack() { 
/* Empty */ 

} 

int CharStack::size() { 
return elements.size(); 


) 


bool CharStack::isEmpty() ( 
return elements.isEmpty(); 


) 





图 12-6 使 用 Vector 的 CharStack 类 的 实现 
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void CharStack::clear() ( 
elements.clear(); 


) 


void CharStack::push(char ch) { 
elements .add (ch); 
} 


char CharStack::pop() { 
if (isEmpty()) error("pop: Attempting to pop an empty stack"); 
char result = elements [elements .size() - 1]; 
elements.remove(elements.size() - 1); 
return result; 


) 


char CharStack::peek() ( 
if (isEmpty()) error("peek: Attempting to peek at an empty stack"); 
return elements[elements.size() - 1]; 





图 12-6 (£X) 


选择 Vector<char> 作为 字符 栈 类 的 底层 表示 是 一 个 正确 的 做 法 。 你 应 该 总 是 注意 寻 
找 根据 已 解决 的 问题 能 够 构造 出 解决 你 新 问题 的 方法 。 此 外 ， 作 为 一 种 软件 工程 策略 ， 采 
用 Vector 类 来 实现 栈 类 绝对 没 错 。Stack 类 的 库 版 本 正 是 这 样 做 的 。 唯 一 的 问题 是 采用 
Vector 会 减弱 示例 的 指导 价值 。 实 现 Vector 类 很 明显 比 实现 栈 类 更 复杂 。 采 用 Vector 
类 作为 底层 表示 对 搞 清楚 CharStack 类 的 操作 并 无 帮助 ， 它 仅 能 把 其 实现 细节 隐藏 起 来 。 

或 许 更 重要 的 是 ， 依 赖 Vector 类 会 使 得 分 析 Charstack 类 的 性 能 更 为 困难 ， 因 为 
Vector 类 隐藏 了 很 多 复杂 性 。 由 于 你 还 不 知道 vector 类 的 细节 ， 你 就 无 法 知道 涉及 在 添 
加 或 删除 其 中 一 个 元 素 时 需要 多 少 工作 ， 如 方法 push 和 pop 所 需要 的 工作 。 以 下 几 章 主 
要 的 目的 是 分 析 数 据 表示 如 何 影 响 算 法 的 效率 。 如 果 所 耗费 的 所 有 代价 都 是 可 见 的 ， 那 么 分 
析 就 很 容易 进行 。 

确保 没有 隐藏 耗费 代价 的 方法 之 一 就 是 限制 实现 ， 以 便 它 只 能 依靠 编程 语言 支持 的 最 
简单 的 操作 。 在 字符 栈 类 的 例子 中 ,采用 内 置 的 数组 类 型 来 存储 元 素 的 优势 使 数组 不 会 隐藏 
任何 东西 。 从 一 个 数组 中 选取 一 个 元 素 需 要 几 个 机 器 指令 ， 这 在 现代 计算 机 上 只 需 耗 费 很 少 
的 时 间 。 在 堆 中 分 配 数组 空间 或 是 不 再 使 用 它 时 回收 其 空间 ， 通 常 都 比 选择 元 素 耗 费 更 多 的 
时 间 ， 然 而 这 些 操 作 仍 然 是 以 常量 时 间 运 行 的 。 在 一 个 典型 的 内 存 管理 系统 中 ， 分 配 一 个 
1000 字 节 的 内 存 块 和 分 配 一 个 10 字 节 的 内 存 块 花费 的 时 间 一 样 。 

尽管 上 述 操作 提供 常量 时 间 的 运行 性 能 ， 但 是 这 也 不 能 立即 确定 数组 应 作为 集合 类 的 底 
层 表 示 。 正 如 在 本 节 一 开始 提 到 的 ,不 管 为 了 在 栈 中 存储 字符 你 采用 什么 样 的 表示 ， 都 必须 
允许 其 存储 容量 可 以 扩充 。 而 数组 却 做 不 到 。 一 旦 你 为 数组 分 配 了 空间 ， 那 么 它 的 大 小 就 不 
能 再 改变 。 

然而 ,你 可 以 做 的 是 首先 给 数组 分 配 某 个 固定 大 小 的 空间 ,一 旦 其 空间 越界 时 就 可 以 用 
一 个 更 大 的 数组 替换 它 。 在 这 个 过 程 中 ,你 必须 把 原来 数组 的 所 有 元 素 复制 到 新 的 数组 中 ， 
并 且 确 保 原来 数组 所 占用 的 内 存 已 被 回收 。 一 旦 你 完成 了 这 些 工 作 ， 新 数组 就 会 拥有 你 所 期 
望 的 存储 空间 。 

为 了 存储 栈 元 素 ， 私 有 部 分 的 新 版 本 需要 记录 某 些 变 量 值 。 最 为 重要 的 是 在 Charstack 
类 中 需要 一 个 指向 包含 所 有 字符 的 动态 数组 指针 。 同 时 也 需要 记录 这 个 动态 数组 的 大 小 ( 即 
可 存储 多 少 个 元 素 )， 以 便 程 序 能 分 辨 出 该 栈 何 时 用 完了 存储 空间 ， 并 需要 重新 给 它 分 配 新 
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的 空间 。 因 为 这 个 值 表 示 出 数组 在 当前 情况 下 可 以 存储 多 少 个 字符 ， 所 以 该 值 通常 被 称 为 动 
态 数组 的 容量 (capacity)。 最 后 ， 记 住 这 种 字符 数组 只 能 包含 比 它 限 定 容量 少 1 个 的 字符 。 
因此 这 个 数据 结构 需要 包含 一 个 记录 该 数组 当前 有 效 元 素 个 数 的 变量 。 在 私有 部 分 包含 这 三 
个 实例 变量 使 得 实现 这 个 堆 操作 和 数组 操作 的 复杂 度 相 当 。charstack 类 中 更 新 的 私有 部 
分 显示 在 图 12-7 中 ， 相 关 的 实现 部 分 显示 在 图 12-8 中 。 


Private section */ 


Implementation notes 


In this version of CharStack, the characters are stored in a dynamic 
* array that doubles in size whenever the stack runs out of space. 


wp 


private: 


/* Private constants */ 
static const int INITIAL CAPACITY - 10; 
/* Instance variables */ 


char *array; /* Dynamic array of characters */ 
int capacity; /* Allocated size of that array */ 
int count; /* Current count of chars pushed */ 


Private function prototype */ 


void expandCapacity () ; 





图 12-7 用 动态 数组 实现 的 charstack 类 的 私有 部 分 


/* 
* File: charstack.cpp 


* This file implements the CharStack class. 
*/ 

#include "charstack.h" 

#include "error.h" 

using namespace std; 

/* 
* Implementation notes: constructor and destructor 

The constructor allocates the array storage for the stack elements and 


initializes the fields of the object. The destructor frees any heap 
memory allocated by the class, which is just the array of elements. 


CharStack::CharStack() { 
capacity = INITIAL CAPACITY; 
array = new char[capacity]; 
count 0; 


Implementation notes: -CharStack 


The destructor frees any heap memory allocated by the class, which 
* is just the dynamic array of elements. 
yf 
CharStack::-CharStack() { 
delete[] array; 
) 
/* 


* Implementation notes: size, isEmpty, clear 


* These methods are each a single line and need no detailed documentation. 


* 





图 12-8 ”基于 数组 的 CharStack 类 的 实现 
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int CharStack::size() ( 
return count; 


} 


bool CharStack::isEmpty() { 
return count == 0; 


} 


void CharStack::clear() { 
count = 0; 


} 
/* 


This function first checks to see whether there is enough room for 
the character and then expands the array storage if necessary. 


wf 


void CharStack::push(char ch) { 
if (count -- capacity) expandCapacity(); 
array [count++] = ch; 


Implementation notes: pop, peek 


These functions check for an empty stack and report an error if 
there is no top element. 


char CharStack::pop() ( 
if (isEmpty()) error("pop: Attempting to pop an empty stack"); 
return array[--count]; 


) 


char CharStack::peek() ( 
if (isEmpty()) error("peek: Attempting to peek at an empty stack"); 
return array[count - 1]; 


} 


Implementation notes: expandCapacity 


This method doubles the capacity of the elements array whenever it runs 
out of space. To do so, the method must copy the pointer to the old 
array, allocate a new array with twice the capacity, copy the characters 
from the old array to the new one, and finally free the old storage. 


void CharStack::expandCapacity() { 
char *oldArray - array; 
capacity *- 2; 
array = new char[capacity]; 
for (int i = 0; i « count; i++) { 
array[i] = oldArray[i]; 


) 
delete[] oldArray; 





图 12-8 (4) 


尽管 在 charstack.cpp 中 的 大 多 数 代码 跟 你 在 本 书 中 较 早 看 到 的 类 很 类 似 ， 一 小 
部 分 方法 包含 了 特别 的 注释 。 例 如 ， 构 造 函 数 必须 初始 化 表示 一 个 空 栈 的 内 部 数据 结构 。 
count 变量 必须 为 0， 但 没有 理由 不 提供 一 些 带 有 某 些 初始 容量 的 栈 。 在 该 实现 中 ， 构 造 
函数 提供 了 以 常量 INITIAL CAPACITY 值 为 10 的 字符 空间 。 这 个 常量 值 没有 什么 神奇 之 
处 ， 任 何 整数 都 可 以 作为 其 值 。 选 择 一 个 大 一 点 的 值 会 减 小 栈 需要 扩充 的 频率 ， 因 此 节省 了 
执行 时 间 ; 而 选择 小 一 点 的 值 可 以 节省 内 存 。 决 定 一 个 适当 的 值 是 时 间 一 空间 平衡 的 一 个 实 
例 ， 这 个 话题 将 在 第 13 章 更 详细 地 加 以 讨论 。 

CharStack 类 的 下 一 个 方法 是 其 析 构 函数 ， 如 果 没 有 什么 特别 的 原因 ， 这 应 该 是 你 
第 一 次 看 到 的 析 构 函数 。 大 部 分 析 构 函数 的 职责 是 释放 为 类 的 对 象 所 分 配 的 堆 空间 ， 当 
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CharStack 准备 回收 空间 时 ， 唯 一 指向 所 分 配 的 堆 空间 的 指针 是 动态 数组 ， 它 的 地 址 存储 
在 实例 变量 array 中 ， 因 此 ， 析 构 函 数 的 实现 : 


CharStack::-CharStack() ( 
delete[] array; 
} 


delete 关键 字 后 的 一 对 空 方 括号 是 必需 的 ， 因 为 它 的 目标 是 释放 整个 动态 数组 而 非 该 动态 
数组 的 某 个 单元 。 

在 push 方法 中 最 大 的 改变 来 自 于 基于 矢量 的 实现 ，push 方法 的 功能 是 在 栈 顶 向 栈 
内 增加 一 个 新 字符 。 只 要 该 字符 栈 有 空间 能 存储 一 个 字符 ，push 方法 就 会 在 它 第 一 个 
不 用 的 数组 位 置 处 存储 它 ， 并 将 count 域 值 加 1。 反 之 ， 若 数组 中 没有 剩余 的 空间 ， 事 
情 就 会 变 得 复杂 。 此 时 ，push 方法 的 实现 必须 分 配 有 额外 更 多 空间 的 一 个 新 数组 ， 然 
后 将 原来 数组 中 的 元 素 拷贝 到 新 数组 。 除 了 包括 push 方法 本 身 的 代码 外 ， 图 12-8 中 
的 代码 还 委托 其 任务 给 一 个 私有 的 expandCapacity 辅助 方法 。 和 所 有 辅助 方法 一 样 ， 
expandCapacity 的 原型 出 现在 类 定义 的 私有 部 分 ， 其 实现 代码 在 .cpp 文件 中 。 正 如 你 
在 代码 中 所 看 到 的 那样 ，expandcapacity 方法 开始 存储 一 个 指向 原 数 组 的 指针 。 然 后 它 
分 配 一 个 具有 原 数 组 两 倍 容 量 的 一 个 新 数组 ， 再 把 原 数组 的 所 有 字符 拷贝 到 新 数组 ， 最 后 释 
放 旧 数组 的 存储 空间 。 

C++ 使 用 析 构 函数 来 解决 内 存 释放 问题 并 不 是 一 个 神奇 的 解决 方案 。charstack.cpPp 
的 实现 使 得 这 点 更 清楚 ， 你 仍然 要 密切 关注 内 存 管理 并 确保 你 的 实现 释放 了 其 所 分 配 的 
堆 空 间 。 析 构 函 数 的 优势 在 于 向 用 户 隐藏 了 内 存 管理 的 复杂 性 。 一 个 用 户 可 以 声明 一 个 
CharStack 对 象 ， 使 用 它 一 次 ， 接 着 忘掉 它 。 只 要 字符 栈 的 堆 空间 溢出 ，charStack 类 
的 实现 就 负责 释放 其 空间 。 


12.5 H- 栈 图 


不 画 大 量 的 图 很 难 理解 内 存 分 配 是 如 何 工作 的 。 以 我 的 经 验 ， 可 视 化 内 存 分 配 过 程 的 最 
有 效 工 具 就 是 堆 - 栈 图 ( heap-stack diagram)， 在 这 类 图 中 ， 你 可 以 同时 画 出 堆 和 栈 的 内 存 
状态 。 通 过 new 操作 符 动 态 分 配 的 内 存 画 在 图 的 左边 ， 它 表示 堆 。 对 于 每 个 函数 调用 的 栈 
帧 画 在 图 的 右边 。 

画 堆 - 栈 图 不 像 编写 代码 的 过 程 (总 是 要 求 创造 性 )， 它 是 必 不 可 少 的 机 械 活 动 。 然 而 ， 
事实 并 不 意味 着 这 个 过 程 很 琐碎 ， 或 者 你 从 这 些 图 中 获得 的 洞察 是 不 重要 的 。 当 我 帮助 学 生 
调试 他 们 的 代码 时 ， 发 现 画 这 些 图 是 有 助 于 学 生 解 决 代码 令 人 丧气 的 阻塞 点 的 最 好 办 法 。 如 
果 花 几 分 钟 画 几 幅 图 节省 了 几 个 小 时 的 诅 形 ,那么 画图 所 花费 的 时 间 肯 定 是 非常 值得 的 。 

理解 如 何 去 绘制 堆 - 栈 图 的 最 好 方法 就 是 通过 实例 学 习 。 假 设 你 已 经 在 图 12-8 中 定义 
J CharStack 类 ， 然 后 想 通过 运行 下 面 的 主 程序 去 测试 它 ， 测 试 程序 将 字母 表 的 每 个 字母 
压 进 一 个 新 声明 的 CharStack 对 象 cstk 中 : 


int main() ( 
CharStack cstk; 
for (int i = 0; i < 26; i++) { 
cstk.push(char('A' + i)); 
} 


return 0; 


362 £12* 


你 应 该 忽视 程序 实际 上 并 没有 产生 任何 输出 这 一 事实 。 这 个 例子 的 关键 不 是 程序 做 了 什 
么 ， 而 是 它 如 何在 栈 和 堆 中 分 配 内 存 的 。 这 节 的 剩余 部 分 将 以 一 系列 堆 - 栈 图 来 记录 该 测试 
程序 的 执行 过 程 ， 图 12-9 概述 了 堆 - 栈 图 的 构建 过 程 。 我 确信 在 你 理解 了 编译 器 分 配 内 存 
的 规则 之 前 ， 这 个 堆 - 栈 图 通过 几 次 这 个 过 程 会 对 你 有 所 和 帮助。 一旦 你 掌握 了 其 思想 ， 就 不 
用 每 次 执行 上 述 的 整个 过 程 了 。 


1. 以 空 图 开始 。 在 开始 画 堆 — 栈 图 之 前 ， 首 先 在 页 面 上 画 一 条 垂直 线 将 堆 空 间 与 栈 空间 分 隔 开 。 一 开始 ， 分 隔 
线 两 边 的 图 都 是 空 的 。 在 一 台 典 型 的 机 器 上 ， 堆 是 朝 着 高 存储 地 址 方向 进行 扩展 ， 因 此 在 页 面 上 堆 是 自 项 向 
下 延伸 的 。 而 栈 是 朝 着 相反 的 方向 扩展 ， 因 此 ， 栈 在 页 面 上 是 自 底 向 上 延伸 的 。 在 本 书 的 堆 - 栈 图 中 ， 令 堆 
的 首 地 址 为 1000， 栈 的 末 字 节 地 址 为 FFFF， 这 种 地 址 选择 更 便于 堆 与 栈 的 扩展 。 

2. 手动 模拟 程序 执行 时 的 内 存 分 配 。 内 存 分 配 发 生 在 程序 运行 时 ， 它 是 一 个 动态 过 程 。 为 了 和 弄 清楚 在 特定 时 间 
点 的 内 存 情况 ， 你 需要 从 一 开始 就 跟踪 程序 。 当 你 这 样 做 了 之 后 ， 其 余 的 规则 将 适用 于 合适 的 时 间 点 。 

3. 为 每 个 函数 或 方法 调用 添加 一 个 新 的 栈 帧 。 程 序 每 次 开始 一 个 函数 调用 时 (包括 main 函数 的 初始 调用 )， 在 
图 中 栈 的 这 边 就 分 配 一 块 新 的 内 存 以 存储 该 调用 的 栈 帧 内 容 。 一 步 步 地 画 出 栈 帧 内 容 以 描述 其 产生 过 程 是 非 
常 值得 的 。 
3a) 添加 一 个 用 灰色 和 矩形 表示 的 首 字 单元 。 正 如 本 章 所 指出 的 ， 该 灰色 区 域 的 内 容 与 机 器 相关 ， 但 是 画 这 个 
灰色 矩形 有 助 于 我 们 在 视觉 上 分 隔 栈 帧 。 
3b) 将 所 有 在 函数 中 声明 的 局 部 变量 包含 进 栈 帧 中 。 所 创建 的 栈 帧 的 大 小 依赖 于 在 函数 中 所 声明 的 变量 个 数 。 
仔细 阅读 代码 并 找到 所 有 在 函数 中 所 声明 的 局 部 变量 ， 包 括 函数 参数 ， 它 也 属于 局 部 变量 。 在 栈 帧 中 分 配 你 
找到 的 所 有 局 部 变量 所 需要 的 存储 空间 ， 然 后 用 变量 名 标记 该 空间 。 通 过 引用 传递 的 参数 仅 占用 一 个 指针 空 
间 而 非 其 参数 值 所 占用 的 空间 。 如 果 该 调用 是 一 个 方法 调用 ， 栈 帧 还 应 另外 包含 一 个 标记 为 this 的 单元 用 
来 指向 当前 对 象 。 栈 帧 中 变量 的 顺序 是 任意 的 ， 因 此 你 可 以 按照 你 想 要 的 顺序 来 重新 排序 这 些 变 量 。 
3c) 通过 拷贝 实 参 的 值 来 初始 化 形 参 。 当 画 出 了 栈 帧 中 的 所 有 局 部 变量 后 ， 你 需要 将 实 参 值 赋 值 给 相应 的 形 
参 变量 。 需 要 注意 的 是 ，C++ 中 形 参 是 值 传递 的 ， 除 非 形 参 变量 声明 为 引用 类 型 ， 否 则 赋值 顺序 是 按照 形 参 
顺序 而 非 它们 的 名 字 来 决定 的 。 当 某 个 参数 使 用 引用 传递 时 ， 你 无 需 赋 实 参 的 值 给 形 参 ， 仅 需 将 实 参 的 地 址 
赋 给 栈 帧 中 相应 的 形 参 即 可 。 
3d) 继续 手动 模拟 函数 体 的 执行 过 程 。 一 旦 你 初始 化 了 形 参 ， 你 就 准备 好 了 执行 函数 体 代码 步 又 的 过 程 。 这 
个 过 程 很 可 能 涉及 赋值 (规则 4 )、 动 态 分 配 (规则 5) ) 和 函数 嵌 套 调用 (规则 3 的 递归 调用 )。 
3e) 当 函 数 返回 时 ， 释 放 整 个 栈 帧 。 当 你 执行 完 一 个 函数 调用 后 ， 正 在 使 用 的 栈 帧 就 会 被 自动 释放 。 在 栈 帧 
图 中 ， 你 可 以 轻易 地 删除 这 块 被 释放 的 空间 。 下 一 个 函数 调用 会 重用 这 些 相同 的 内 存 空 间 。 

. 以 从 右 到 左 的 方向 通过 拷贝 值 来 执行 每 一 条 赋值 语句 。 赋 值 的 种 类 取决 于 所 赋值 的 类 型 。 如 果 所 赋 的 值 属于 
基本 类 型 或 者 枚 举 类 型 ， 则 你 仅 需 简单 地 将 该 值 拷贝 给 赋值 号 左边 的 变量 即 可 。 如 果 你 将 一 个 指针 值 赋 给 一 
个 指针 变量 ， 则 是 该 指针 被 拷贝 赋值 ， 而 非 指针 所 指向 的 值 被 拷贝 赋值 。 而 且 ， 由 于 C++ 将 数组 名 看 作 是 指 
向 数组 起 始 元 素 的 指针 的 同义词 ， 因 此 ， 将 一 个 数组 名 赋值 给 一 个 变量 ， 则 赋值 的 是 数组 指针 ， 即 数组 起 始 
元 素 的 地 址 ， 而 非 数组 中 的 元 素 。 如 果 你 将 一 个 对 象 赋值 给 另外 一 个 对 象 ， 则 赋值 的 语义 取决 于 该 对 象 所 属 
的 类 中 是 如 何 定义 这 个 赋值 操作 的 。 

. 当 程 序 显 式 动态 申请 内 存 时 ， 将 分 配 新 的 堆 内 存 空间 。 仅 当 一 个 new 操作 符 明 确 地 出 现在 一 个 表达 式 中 ， 
C++ 程序 才 会 在 堆 中 创建 新 的 内 存 。 一 旦 你 看 到 关键 字 new， 就 需要 在 堆 中 开辟 足够 的 空间 以 容纳 动态 
分 配 的 值 。new 操作 符 的 值 为 一 个 指向 所 动态 申请 分 配 的 堆 空间 的 首 地 址 指针 值 ， 正 如 其 他 类 别 的 指针 
值 一 样 。 





图 12-9 创建 堆 - 栈 图 需 遵 循 的 步骤 


对 于 任何 C++ 程序 ， 发 生 的 第 一 件 事 情 就 是 操作 系统 调用 主 函 数 。 在 这 个 例子 中 ， 主 
函数 声明 了 两 个 局 部 变量 : CharStack 类 型 的 cstk 变 量 和 for 循 环 的 索引 变量 io 
CharStack 对 象 要求 三 个 字 的 内 存 : 一 个 是 动态 数组 的 地 址 ， 另 外 是 整 型 域 capacity 和 
count。 在 初始 化 之 前 ， 栈 帧 结构 如 下 图 所 示 〈 因 堆 中 此 时 还 没有 分 配 任何 东西 ， 所 以 图 的 
左边 现在 是 空 的 ): 
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cstk.array 
cstk.capacity 


cstk.count 





声明 一 个 CharStack 类 的 对 象 时 ，C++ 会 自动 调用 Charstack 类 的 构造 函数 。 即 使 
这 个 构造 函数 没有 参数 ， 也 没有 声明 局 部 变量 ， 其 栈 帧 结构 仍然 包含 一 个 被 称 为 this 的 指 
向 当前 对 象 的 系统 指针 ， 由 于 每 一 个 方法 调用 都 将 this 作为 隐 含 参数 ， 因 此， 在 这 种 情况 
下 ， 主 程序 中 的 this 指向 对 象 cstk， 如 下 图 所 示 : 


this 


cstk.array 
cstk.capacity 
cstk.count 


i 





构造 函数 中 的 步骤 相当 易 懂 。 在 构造 函数 中 的 每 一 个 变量 都 是 当前 对 象 中 的 一 个 数据 
域 。 第 一 行将 cstk 对 象 的 容量 设 为 常量 INITIAL CAPACITY， 它 的 值 为 10。 第 二 行 分 
配 了 一 个 可 容纳 10 个 字符 的 动态 数组 。 使 用 操作 符 new 可 分 配 任意 大 小 的 堆 空间 ， 故 这 个 
动态 数组 的 空间 被 分 配 到 堆 上 。 在 C++ 中 ，char 类 型 占据 一 个 字 节 ， 因 此 该 数组 在 堆 内 存 
中 需要 10 个 字 节 ， 由 于 计算 机 分 配 内 存 是 以 机 器 字 的 整数 倍 来 分 配 ， 因 此 ， 在 堆 中 为 数组 
分 配 了 3 个 字 ( 即 12 个 字 节 ) 的 空间 。 最 后 一 行将 cstk MAM count 初始 化 为 0， 表明 
该 栈 为 空 。 堆 和 栈 的 内 容 现在 如 下 图 所 示 : 


cstk.array 
^ |estk.capacity 


cstk.count 





构造 函数 返回 ，cstk 对 象 初始 化 的 内 容 如 上 图 所 示 。 

当 第 一 次 for 循环 开始 时 ， 即 i 值 为 0 时 ， 开 始 方 法 的 调用 。 该 循环 产生 了 一 个 以 参 
数字 符 'A' 的 cstk.push 的 调用 。 再 说 一 次 ，push 也 是 一 个 方法 调用 ， 因 此 它 包含 一 个 
指针 变量 this 及 参数 ch， 如 下 图 所 示 : 
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cstk.array 
' |estk.capacity 


cstk.count 


Zi count 不 等 于 capacity， 则 这 个 调用 会 执行 下 去 。 此 时 ， 字 符 ch 被 复制 到 动态 数组 
H, count 值 会 自 增 1， 如 下 图 所 示 : 


cstk.array 
— ——Q Mom 


cstk.count 


for 循环 接 下 来 的 九 个 循环 都 以 上 述 同样 的 方式 进行 ， 在 可 用 的 栈 空间 中 填充 了 如 下 
内 容 : 


cstk.array 
cstk.capacity 


cstk.count 








这 次 方法 调用 与 之 前 调用 的 不 同 在 于 count 等 于 capacity， 它 表明 数组 中 已 有 的 字符 已 
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经 填 满 了 。 这 种 情况 引发 了 类 中 的 一 个 私有 方法 expandCapacity 的 调用 ， 这 导致 创建 了 
另 一 个 栈 帧 。expandCcapacity 方 法 中 声明 了 局 部 变量 oldArray Ai, KERA XH ja 
部 变量 现在 会 出 现在 栈 帧 中 ， 并 伴随 着 一 个 指向 当前 对 象 的 指针 。 所 产生 的 结果 栈 帧 显示 在 
下 图 的 顶部 : 







cstk.array 
cstk.capacity 


cstk.count 


expandCapacity 方法 中 的 操作 很 有 趣 ， 它 使 得 浏览 该 过 程 的 细节 更 有 意义 。 以 下 代 
码 行 : 

char *oldArray = array; 

capacity *- 2; 

char *array = new char[capacity]; 
它 的 功能 是 新 分 配 一 个 为 原 数组 两 倍 容量 的 动态 数组 ， 然 后 将 新 分 配 的 动态 数组 的 指针 拷贝 
到 旧 的 数组 指针 中 。 如 下 图 所 示 : 


cstk.array 
~~“ lestk.capacity 


cstk.count 


for 循环 将 旧 数组 中 字符 拷贝 给 新 的 数组 ， 使 得 产生 了 以 下 的 堆 和 栈 帧 内 容 : 
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cstk.array 
cstk.capacity 


cstk.count 





expandCapacity 方法 的 最 后 一 条 语句 是 : 
delete[] oldArray; 


它 释 放 了 旧 数 组 的 内 存 ， 使 得 在 expandcapacity 返 回 后 其 堆 及 栈 帧 中 的 内 容 如 下 图 
所 示 : 


cstk.array 
cstk.capacity 


cstk.count 





既然 在 新 的 数组 中 还 有 空间 ，push 方法 就 可 以 像 它 之 前 那样 操作 。push 返回 后 的 状 
态 如 下 图 所 示 : 






cstk.array 


cstk.capacity 


cstk.count 





Dies 
debt 


X count 变 为 20 时 ， 然 后 主 程序 继续 通过 字母 表 的 其 他 字符 再 次 对 数组 的 容量 扩充 加 倍 。 

这 个 例子 中 唯一 要 注意 的 是 main 函数 的 返回 。 此 目 MA cstk 已 超出 了 其 作用 域 范 
围 ， 因 此 ， 它 会 引起 ~charstack 析 构 函数 的 调用 。 析 构 函 数 确保 在 字符 栈 的 生命 周期 结 
束 时 所 分 配 的 堆 上 的 动态 数组 内 存 被 回收 。 


12.6 单元 测 试 
上 一 节 的 主 程序 作为 堆 - 栈 图 的 说 明 是 很 有 用 的 ， 但 通过 弹出 这 些 字 母 并 以 道 序 输出 
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它们 来 展示 栈 的 细节 ， 并 没有 真正 构成 对 CharStack 类 的 一 个 充分 的 测试 。 当 你 为 用 户 定 
义 一 个 新 类 时 ， 很 有 必要 尽 可 能 彻底 地 去 测试 你 所 涉及 的 程序 实现 。 未 经 测试 的 程序 总 会 存 
在 很 多 问题 。 作 为 一 个 实现 者 ， 你 的 职责 就 是 把 像 CharStack 这 样 的 类 按照 其 功能 进行 测 
试 ， 检 查 在 预期 模式 的 近似 使 用 的 条 件 下 接口 输出 的 每 一 个 方法 。 例 如 ,在 charstack 类 
的 对 象 中 ， 压 人 足够 多 的 字符 以 确保 expandCapacity 像 以 前 那样 理想 化 地 被 调用 是 很 重 
要 的 。 

为 每 一 个 类 或 库 接口 开发 一 个 独立 的 测试 程序 也 是 一 个 很 好 的 实践 。 如 果 你 设计 的 测试 
程序 能 正确 地 依赖 几 个 类 的 功能 ， 那 么 在 运行 出 错 的 时 候 很 难 确定 故障 在 哪儿 。 在 与 其 他 模 
块 独立 的 情况 下 ,分别 检查 每 二 个 类 或 接口 的 策略 被 称 为 单元 测试 (unit testing)。 图 12-10 
展示 了 CharStack 类 的 一 个 可 能 的 单元 测试 ， 它 包含 了 存 人 字母 表 中 字母 的 代码 ， 接 着 确 
保 它们 以 相反 的 顺序 出 栈 ， 还 包含 了 对 类 中 方法 是 否 按 它 们 的 功能 运行 的 检测 。 

j 
* File: CharStackUnitTest.cpp 
* This file contains a unit test of the CharStack class that uses the 


* C++ assert macro to check that each operation performs as it should. 


*/ 


#include <iostream> 
#include <cassert> 
#include "charstack.h" 
using namespace std; 


int main() { 
CharStack cstk; Declare an empty CharStack 
assert (cstk.size() == 0); Make sure its size is 0 
assert (cstk.isEmpty ()) ; And that isEmpty is true 
cstk.push('A'); Push the character 'A' 
assert(!cstk.isEmpty()); The stack is now not empty 
assert(cstk.size() == 1); And has size 1 
assert(cstk.peek() -- 'A'); Check that peek returns 'A' 
cstk.push('B'); Push the character 'B' 
assert(cstk.peek() -- 'B'); Make sure peek returns it 
assert(cstk.size() == 2); And that the size is now 2 
assert(cstk.pop() == 'B'); Pop and test for the 'B' 
assert(cstk.size() -- 1); Recheck the size 
assert(cstk.peek() == 'A'); And make sure 'A' is on top 
cstk.push('C'); Test a push after a pop 
assert(cstk.size() -- 2); Make sure size is correct 
assert(cstk.pop() == 'C'); And that pop returns a 'C' 
assert (cstk.peek() == 'A'); The 'A' is now back on top 
assert(cstk.pop() == 'A'); Pop and test for the 'A' 
assert(cstk.size() -- 0); And make sure size is 0 
for (char ch = 'AÀ'; ch <= 'Z'; ch++) { Push the entire alphabet 
cstk.push(ch); one character at a time 
) to test stack expansion 
assert(cstk.size() -- 26); Make sure the size is 26 
for (char ch = 'Z'; ch »- 'A'; ch--) ( Pop the characters in 
assert(cstk.pop() -- ch); reverse order to make 
) sure they're all there 
assert(cstk.isEmpty()); Ensure the stack is empty 
for (char ch = 'A'; ch <= 'Z'; ch++) { Push the alphabet again to 
cstk.push(ch); test that it works after 
) expansion 
assert(cstk.size() -- 26); Check that size is again 26 
cstk.clear(); Check the clear method 
assert(cstk.size() -- 0); And check if stack is empty 
cstk.clear(); Test clear with empty stack 
assert(cstk.size() -- 0); 
cout «« "CharStack unit test succeeded" «« endi; 
return 0; 





图 12-10 CharStack 类 的 单元 测试 
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在 charStackUnitTest.cpp 文 件 中 独立 的 测试 都 是 用 «cassert» 库 输 出 的 assert 机 
制 编 码 的 。assert 调用 (CEA C++ 的 宏 机 制 实现 ， 宏 已 超出 了 本 书 的 范围 ) 具有 以 下 形式 : 


assert (/es/) ; 


只 要 测试 表达 式 test HEA true, M assert 宏 就 不 起 作用 。 然 而 ， 如 果 测 试 结果 为 
false, JA assert 宏 会 发 出 故障 信息 ， 并 且 以 一 个 表示 程序 失效 的 状态 码 退 出 程序 。 
assert 消息 的 格式 是 与 系统 相关 的 ,但 典型 的 如 下 图 所 示 : 





(OOO CharStackUnitTest __ "tem 
|Assertion failed: (cstk.size() -- 0), function main, 
file CharStackUnitTest.cpp, line 15. 


| 
| ; | 
f , perd 





这 个 消息 包括 了 测试 失效 的 文本 ， 它 使 得 寻找 故障 的 来 源 更 加 简便 。 

尽管 测试 对 于 软件 开发 非常 重要 ， 但 它 不 能 抵消 细心 实现 代码 的 必要 ， 因 为 用 户 有 各 种 
各 样 的 使 用 类 库 的 方式 。 已 故 的 艾 效 格 " W“' 迪 科 斯 彻 (Edsger W. Dijkstra) 在 1972 发 表 的 
论文 《结构 化 程序 设计 》(Notes on Structured Programming) 中 定义 了 测试 的 重要 性 : 

程序 测试 是 说 明 程 序 漏洞 的 存在 性 ， 而 不 是 证 明 程 序 的 正确 性 ! 

作为 一 个 实现 者 ， 你 需要 掌握 减少 故障 的 不 同 技巧 。 认 真 的 设计 有 利于 简化 程序 的 总 体 结 
构 ， 使 得 能 够 更 加 容易 找到 哪里 出 错 。 手 动 跟踪 你 的 代码 (使 用 堆 - 栈 图 或 任何 有 用 的 策 
WE) 可 以 在 正式 测试 开始 之 前 发 现 漏洞 。 大 多 数 情 况 下 ， 让 其 他 程序 员 检 查 你 的 代码 是 发 现 
你 所 忽视 的 问题 的 最 好 方法 之 一 。 在 软件 行业 内 ， 软 件 开发 周期 中 的 这 个 过 程 常 由 一 系列 预 
定 的 代码 审查 (code review) 来 形式 化 。 


12.7 拷贝 对 和 象 


正如 图 12-7 和 图 12-8 所 示 ，CharStack 类 的 定义 并 没有 完成 。 只 要 你 通过 引用 传递 
每 一 个 CharStack 的 对 象 ， 并 且 从 不 将 CharStack 对 象 的 值 赋 给 另 一 个 对 象 ， 就 不 会 有 
什么 问题 。 但 是 ， 如 果 你 的 代码 想 通过 值 传递 一 个 Charstack 对 象 ， 或 者 试图 复制 一 个 已 
经 存在 的 CharStack 对 象 时 ， 你 的 程序 很 可 能 会 以 无 法 预料 的 方式 崩溃 。 


12.7.1 RENER 

当前 对 于 CharStack 类 的 实现 的 一 个 关键 问题 是 : C++ 在 对 象 之 间 赋 值 的 方法 往往 都 
行 得 通 ， 但 是 当 对 象 包含 动态 分 配 的 内 存 时 就 会 出 现 问题 。 默 认 情 况 下 ，C++ 通过 拷贝 每 一 
个 对 象 的 实例 变量 值 来 给 另外 一 个 对 象 赋值 。 如 果 这 些 值 是 常用 的 数据 类 型 (如 数字 、 字 符 
及 其 他 类 似 的 类 型 )， 那 么 拷贝 操作 会 像 你 想 的 那样 做 。 然 而 ， 如 果 该 值 是 一 个 指针 ， 则 拷 
贝 该 指针 并 不 能 实际 地 拷贝 它 所 指 的 值 。C++ 默认 的 拷贝 为 浅 拷贝 (shallow copying), BE 
不 能 实现 真正 的 拷贝 。 当 你 拷贝 一 个 包含 动态 内 存 的 对 象 时 ， 你 通常 是 想 拷 贝 它 所 指 的 对 象 
中 的 数据 。 这 样 的 拷贝 被 称 为 深 找 贝 (deep copying). 

为 了 对 这 个 问题 的 重要 性 有 更 多 的 理解 ， 考 虑 一 下 ， 如 果 你 执行 下 面 的 代码 会 发 生 什么 : 


CharStack s1, s2; 
sl.push('A'); 
s2 = sl; 
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你 想 让 这 个 程序 做 的 是 通过 拷贝 sl 来 初始 化 s2， 这 意味 着 将 在 两 个 独立 的 栈 顶 都 会 包含 
字符 “ A”。 如 果 C++ 使 用 深 拷贝 来 初始 化 s2， 这 就 是 执行 的 结果 。 然 而 ， 如 果 你 使 用 
C++ 默认 的 浅 拷贝 ， 执 行 这 些 语句 肯定 会 在 程序 的 某 个 时 刻 造成 问题 。 
了 解 程序 代码 工作 最 简单 的 方法 就 是 画 一 个 堆 - 栈 图 ， 用 来 表示 在 一 段 语句 之 后 的 内 存 
状况 。 这 个 图 看 起 来 如 下 图 所 示 : 546 


sl.array 
sl.capacity 
sl.count 
s2.array 


s2.capacity 





s2.count 


2 


浅 拷 贝 已 经 正确 地 拷贝 了 count 和 capacity 的 域 值 ， 但 是 s1 fil s2 的 array 值 一 样 ， 
即 它 们 指向 同一 个 动态 数组 。 如 果 你 从 栈 s2 中 弹出 了 栈 顶 的 字符 ， 再 压 人 一 些 其 他 字符 ， 
这 个 操作 也 会 同样 改变 sl 的 内 容 。 这 不 是 你 想 要 的 将 sl 真正 拷贝 到 s2 中 的 结果 。 

更 糟糕 的 是 ， 当 声明 了 变量 sl 和 s2 的 函数 返回 时 ， 整 个 程序 很 有 可 能 崩溃 。 当 此 情 
况 发 生 时 ， 由 于 这 两 个 变量 都 超出 了 其 作用 域 范围 ， 因 此 会 引发 它们 各 自 CharStack 析 构 
函数 的 调用 。 析 构 函 数 的 第 一 次 调用 会 释放 array， 第 二 次 调用 会 试 着 做 同样 的 事情 。 两 
次 释放 同一 内 存 是 非法 的 ， 但 不 能 保证 C++ 能 检测 并 报告 这 个 错误 。 在 某 些 机 器 上 ， 第 二 
次 调用 free 会 损害 堆 的 内 部 结构 ， 它 会 导致 程序 在 某 点 失效 。 

如 果 你 想 要 拷贝 一 个 有 别 于 原来 的 独立 的 charStack 对 象 ， 那 么 你 就 需要 做 一 个 深 拷 
贝 ， 如 下 图 所 示 : 


sl.array 


sl.capacity 


s2.capacity 





s2.count 


编写 一 个 深 拷贝 的 代码 并 不 难 ， 其 挑战 在 于 : 当 你 把 一 个 CharStack 对 象 赋值 给 另 一 
个 时 ， 让 C++ 来 调用 这 段 深 拷贝 的 代码 。 完 成 这 个 任务 的 编程 模式 会 在 下 一 节 描 述 。 547 


12.7.2 ”赋值 和 拷贝 构造 函数 


在 C++ 中 ， 你 可 以 通过 定义 两 种 方法 来 改变 默认 的 浅 拷贝 行为 。 一 种 方法 是 过 载 赋 
值 操作 符 。 第 二 种 方法 是 定义 一 种 构造 函数 的 特殊 形式 ,该 构造 函数 被 称 为 拷贝 构造 函数 
(copy constructor)， 用 于 从 一 个 已 存在 的 同类 对 象 复制 并 初始 化 另 一 个 对 象 。 在 C++ 中,， 仅 
当 你 用 一 个 已 经 存在 的 对 象 进 行 赋值 时 ,拷贝 构造 函数 才 会 被 调用 。 当 一 个 对 象 首次 被 初始 
化 时 (包括 一 个 带 有 初始 化 器 的 声明 时 )，C++ 也 会 调用 拷贝 构造 函数 。 

默认 情况 下 ， 赋 值 操作 符 和 无 代码 实现 的 拷贝 构造 函数 都 会 像 上 一 节 所 描述 的 那样 创建 
一 个 浅 拷贝 。 如 果 你 想 要 你 的 类 支持 深 拷 贝 ， 就 需要 为 这 两 个 方法 提供 一 个 新 的 定义 ， 使 它 
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们 能 拷贝 动态 分 配 的 数据 。 

在 C++ 中， 如 果 你 尝试 东 拼 西 凑 写 出 赋值 操作 和 拷贝 构造 函数 ， 那 么 其 中 大 量 的 细节 
很 容易 混乱 。 大 多 数 情况 下 ， 最 好 的 办 法 是 从 标准 模式 中 拷贝 这 些 类 函数 ， 接 着 做 出 必要 的 
修改 以 支持 你 的 类 。 图 12-11 表明 了 实现 CharStack 类 的 标准 技术 。 这 段 代 码 重 新 定义 了 
拷贝 构造 函数 和 赋值 操作 符 ， 它 们 的 实现 是 将 大 部 分 工作 委托 给 了 deepCopy 私有 方法 。 


/* 

* Implementation notes: copy constructor and assignment operator 

* 
* These methods make it possible to pass a CharStack by value or 
* assign one CharStack to another. The actual work is done by the 
* private deepCopy method, which represents a useful pattern 
* for designing other classes that need to implement deep copying. 
* 


/ 


CharStack::CharStack(const CharStack & src) { 
deepCopy (src) ; 
) 


CharStack & CharStack::operator-(const CharStack & src) { 
if (this != &src) { 
delete[] array; 
deepCopy (src); 


return *this; 


Implementation notes: deepCopy 


This method copies the data from the src parameter into the current 
object. All dynamic memory is reallocated to create a "deep copy" 
in which the current object and the source object are independent. 


void CharStack::deepCopy (const CharStack & src) { 
array = new char[src.count]; 
for (int i = 0; i < src.count; i++) { 
array[i] src.array[i]; 


) 
count - src.count; 
capacity = src.capacity; 





图 12-11 CharStack 类 深 拷 贝 的 实现 


当 你 查看 图 12-11 所 示 的 代码 时 ， 很 可 能 注意 到 的 第 一 件 事情 就 是 三 个 方法 的 参数 声明 
都 包含 了 关键 字 const, PUR deepCopy 方法 的 头 文件 说 明 一 样 : 


void deepCopy (const CharStack & src); 


const 关键 字 保证 了 即使 deepCopy 通过 引用 来 传递 也 不 会 改变 src 的 值 。 这 种 参数 传递 
方式 被 称 为 常量 引用 调用 (constant call by reference)。 常 量 引用 调用 的 细节 将 在 本 章 的 稍 后 
部 分 介绍 。 

拷贝 构造 函数 只 是 简单 地 调用 deepCopy 方法 ,将 原来 Charstack 类 的 对 象 内 部 数 
据 拷 贝 给 当前 对 象 的 内 部 数据 中 。 更 有 趣 的 方法 是 重 载 赋值 操作 符 ， 如 以 下 代码 所 示 : 


CharStack & operator-(const CharStack & src) ( 


if (this != &src) { 
delete[] array; 
deepCopy (src) ; 

) 


return *this; 
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上 述 操作 符 重 载 代码 开始 处 的 i£ 语句 用 于 检查 赋值 号 的 左边 和 右边 是 否 实际 上 指向 了 同一 
对 象 。 这 个 测试 是 重 载 赋值 操作 的 标准 模式 中 的 一 个 关键 部 分 。 这 个 测试 的 目的 不 只 是 消除 
不 必要 的 拷贝 操作 。 没 有 这 个 测试 ， 在 调用 deepCopy 拷贝 数据 到 目的 栈 之 前 ，CharStack 
对 象 进 行 的 自身 拷贝 并 不 会 释放 其 所 占用 的 数组 空间 。 重 载 赋值 操作 符 的 最 后 一 行 代 码 也 须 
特别 注意 。 在 C++ 中 ， 赋 值 操作 符 被 定义 为 返回 它 的 左 值 。 关 键 字 this 指向 当前 对 象 的 
指针 ， 因 此 *this 表达 式 代 表 了 对 象 本 身 。 

如 果 觉 得 拷贝 构造 函数 和 重 载 赋 值 操作 符 的 过 程 令 人 困扰 ， 你 还 有 另外 一 种 选择 。 
图 12-12 中 以 更 简单 的 模式 定义 了 私有 的 拷贝 构造 函数 和 重 载 赋值 操作 符 。 这 些 定义 重 置 了 
C++ 提供 的 默认 构造 函数 。 同 时 ， 出 现在 私有 部 分 的 这 些 类 中 的 方法 事实 上 对 用 户 是 不 可 
见 ， 这 能 有 效 防止 用 户 在 任何 环境 下 拷贝 CharStack 对 象 。 例 如 ，C++ 的 标准 库 用 这 种 方 
法 以 避免 拷贝 流 。 

然而 ， 理 解 这 些 复杂 的 事情 并 不 像 知 道 如 何 将 这 些 模 式 融 人 你 自己 设计 的 类 那么 重要 。 
如 果 你 动态 分 配 一 块 内 容 作 为 类 的 一 部 分 ， 那 么 有 责任 重新 定义 拷贝 构造 函数 和 赋值 操作 符 。 
除非 重 载 拷贝 构造 函数 和 赋值 操作 符 ， 否 则 编译 器 会 自动 提供 可 能 会 进行 误 操 作 的 这 些 方法 。 
对 于 你 设计 的 每 个 类 ， 可 以 从 上 述 策略 中 选择 其 一 (不论 是 执行 深 拷贝 或 完全 禁止 拷 

。 你 也 可 以 接着 使 用 图 12-11 或 图 12-12 中 的 代码 作为 模型 ， 用 来 编写 你 的 类 的 必要 部 分 。 


private: 


* Standard methods: copy constructor and assignment operator 


* The following lines make it illegal to copy a CharStack, by defining 


* private versions of the copy constructor and assignment operator. 


ey 


CharStack(const CharStack & src) ( } 
CharStack & operator=(const CharStack & src) { return *this; } 





图 12-12 使 拷贝 不 合 规 定 的 必要 定义 


12.8 关键 字 const 的 使 用 


到 本 章 为 止 ， 唯 一 一 次 你 遇 到 const 关键 字 的 地 方 是 在 常量 值 的 定义 中 ， 如 第 1 章 中 
的 这 个 例子 : 


const double PI = 3.14159265358979323846; 


上 一 节 在 常量 引用 传递 的 例子 中 介绍 了 const 的 另 一 种 新 应 用 。 可 是 专业 的 C++ 程序 员 也 
在 其 他 一 些 环境 中 使 用 const。 很 遗憾 的 是 ， 正 确 地 使 用 const 很 困难 ,特别 是 对 于 初学 
者 。 如 果 你 打算 成 为 一 名 专业 的 C++ 程序 员 ,你 必须 掌握 很 多 const 关键 字 的 微妙 之 处 。 
为 了 帮助 你 接近 这 个 目标 ， 下 一 节 将 概述 const 最 普遍 使 用 和 你 可 能 会 遇 到 的 某 些 陷 阱 。 


12.8.1 常量 定义 


从 第 1 章 开始 ， 你 就 已 经 使 用 const 关键 字 来 命名 一 个 常量 值 。 在 第 2 章 ， 你 学 会 了 
如 何 从 库 接 口中 输出 常量 ， 即 在 .h 和 . cpp 文件 的 声明 中 增加 extern 关键 字 。 你 需要 理 
解 的 唯一 的 其 他 微妙 之 处 是 : 定义 常量 值 时 ， 你 需要 给 声明 的 常量 加 上 关键 字 static， 以 
此 作为 类 的 一 部 分 。 例 如 ,在 charstack.h MEP, 常量 INITIAL CAPACITY 在 私有 
部 分 是 这 样 被 声明 的 : 
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static const int INITIAL CAPACITY = 10; 


这 个 声明 包含 的 static 确保 了 CharStack 类 的 所 有 对 象 共享 一 个 INITIAL CAPACITY 
常量 的 拷贝 ， 而 不 是 CharStack 类 的 每 个 对 象 都 有 这 个 常量 


12.8.2 ”常量 引用 调用 


本 章 之 前 ， 仅 通过 使 用 值 调 用 和 引用 调用 这 些 基本 形式 就 会 使 简化 参数 传递 有 意义 。 然 而 ， 
为 了 实现 深 拷 贝 ， 就 像 12.6 节 说 明 的 一 样 ，C++ 编译 器 要 求 对 拷贝 构造 函数 和 重 载 赋值 操作 符 
函数 使 用 常量 引用 调用 。 但 是 常量 引用 调用 绝 非 仅 限 于 这 些 方法 。 事 实 上 ， 如 果 你 正在 传递 一 
个 对 象 ， 那 么 常量 引用 调用 通常 优 于 传统 的 引用 调用 和 值 调 用 。 在 很 多 方面 ， 常 量 引用 调 
用 结合 了 每 种 参数 传递 的 传统 模式 的 优点 ， 它 提供 了 引用 传递 的 高 效 性 和 值 传递 的 安全 性 。 

尽管 C++ 的 语法 表明 常量 引用 调用 似乎 比 你 以 前 看 到 的 例子 简单 ， 但 如 果 你 试图 将 它 
应 用 到 一 个 指针 参数 时 ， 就 会 变 得 比较 有 技巧 性 。 例 如 ， 考 虑 以 下 函数 原型 : 

int strlen(const char *cptr); 

它 是 一 个 重要 的 库 函 数 ， 用 于 返回 C 风格 的 字符 串 的 长 度 。 如 果 你 类 推 到 常量 引用 调用 
的 早期 例子 ， 可 能 以 为 这 个 原型 中 声明 的 形 参 cptr 是 一 个 指向 字符 的 常量 指针 ， 然 而 
C++ 解释 略微 不 同 。 由 于 此 时 const 后 是 类 型 名 ， 意 味 着 所 声明 的 这 个 cptr 是 一 个 指向 
const char 的 指针 。 基 于 这 样 的 解释 ， 它 能 完全 改变 strlen 函数 内 的 cptr 的 值 ， 而 
不 能 改变 它 所 指向 的 字符 串 的 内 容 。 若 想 防止 改变 cptt 变量 自身 的 值 ， 则 需要 将 const 
放 在 星 号 的 后 面 。 

用 常量 引用 调用 作为 通用 的 替换 值 调用 方式 所 存在 的 唯一 问题 就 是 : 在 参数 前 加 入 
const 关键 字 以 使 C++ 编译 器 保证 这 个 值 不 被 接受 参数 的 函数 所 修改 。 通 常 ， 让 编译 器 执 
行 检测 是 一 件 好 事 。 可 是 ， 为 此 编译 器 必须 要 确定 类 中 哪些 方法 可 以 修改 对 象 ， 哪 些 方法 不 
能 修改 对 象 。 在 C++ 中 ,负责 提供 这 些 信息 职责 的 是 程序 员 。 使 用 常量 引用 调用 的 代价 是 
类 的 设计 者 必须 提供 更 多 的 关于 类 中 定义 方法 的 信息 ， 正 如 下 节 所 描述 的 一 样 。 

12.8.3 const 方法 

在 一 个 典型 的 类 定义 中 ， 某 些 方法 改变 了 对 象 的 值 ， 而 另 一 些 方法 并 未 改变 对 象 的 值 。 
flin, Æ CharStack 类 这 个 例子 中 ，push、pop Al clear 这 些 方法 都 改变 了 其 对 象 栈 中 
WA. FAR, size, isEmpty Ml peek 这 些 方法 仅 返 回 对 象 的 值 。C++ 允许 程序 员 通 过 
在 方法 参数 表 后 面 增加 关键 字 const 来 指定 一 个 方法 ， 它 不 改变 其 对 象 的 状态 。 例 如 ， 在 
charstack.h 文件 中 的 size 方法 原型 应 该 用 关键 字 const 约束 ， 以 通知 编译 器 该 方法 
不 能 改变 对 象 的 状态 ， 如 下 所 示 : 


int size() const; 
const 关键 字 在 方法 的 实现 中 也 必须 出 现 ， 如 下 所 示 : 


int CharStack::size() const ( 
return count; 


} 


如 果 一 个 类 使 用 关键 字 const 来 指明 参数 不 能 发 生 改变 ， 其 方法 不 能 改变 对 象 的 内 容 ， 
则 这 个 类 就 被 称 为 常量 正确 的 (const correct), TE STL 和 Stanford 类 库 中 的 类 都 是 常量 正 
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确 的 。 编 写 常量 正确 的 类 需要 更 多 努力 ， 但 却 能 够 写 出 高 效 易 读 的 代码 。 图 12-13 和 图 12-14 
展示 了 一 个 常量 正确 的 charStack 类 。 552 


File: charstack.h 


This interface defines the CharStack class, which implements 
the stack abstraction for characters. 
*7 


#ifndef  charstack h 
#define  charstack h 


/* 
Class: CharStack 


This class models a stack of characters. The fundamental operations 
are the same as those for the Stack<char> class. 
*/ 
class CharStack { 
public: 
/* 


Constructor: CharStack 
Usage: CharStack cstk; 


Initializes a new empty stack that can contain characters. 


*/ 
CharStack () ; 


Destructor: ~CharStack 
Usage: (usually implicit) 


Frees any heap storage associated with this character stack. 
*/ 


^CharStack(); 


Method: size 
Usage: int nElems - cstk.size(); 


int size() const; 


Method: isEmpty 
Usage: if (cstk.isEmpty()) 


Returns true if this stack contains no characters 
全 下 
bool isEmpty() const; 
/* 


* Method: clear 
* Usage: cstk clear () 


* Removes all characters from this stack. 


*/ 
void clear(); 
Method: push 
Usage: cstk.push{ch) ; 


Pushes the character ch onto this stack. 


*/ 





图 12-13 charstack.h 接口 的 常量 正确 版 本 


void push(char ch); 


Method: pop 
Usage: char cstk.pop(); 


Removes the top character from this stack and returns it 


char pop(); 


Method: peek 
Usage: char ch cstk.peek(); 


Returns the value of the top character from this stack without 
removing it Raises an error if called on an empty stack 


char peek() const; 


Copy constructor: CharStack 
Usage: (usually implicit) 


Initializes the current object to be a deep copy of the specified source. 


y. 


CharStack(const CharStack & src); 


CharStack & operator-(const CharStack & src); 


/* Private section */ 


private: 


/* Private constants */ 


static const int INITIAL CAPACITY - 10; 


/* Instance variables */ 


}; 


char *array; /* Dynamic array of characters x/ 
int capacity; /* Allocated size of that array */ 
int count; /* Current count of chars pushed */ 


Private method prototypes */ 


void deepCopy (const CharStack & src); 
void expandCapacity(); 


#endif 


/ 


# 
LÀ 


u 





图 12-13 (£X) 


* 


* File: charstack.cpp 


* This file implements the CharStack class. 
+ 


include "charstack.h" 
include "error.h" 
sing namespace std; 


图 12-14 charstack.cpp 实现 的 常量 正确 版 本 
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Implementation notes: constructor and destructor 


* The constructor allocates the array storage for the stack elements and 
initializes the fields of the object. The destructor frees any heap 
* memory allocated by the class, which is just the array of elements. 


uz 


CharStack::CharStack() { 
capacity = INITIAL CAPACITY; 
array = new char [capacity]; 
count = 0; 


} 


CharStack::-CharStack() { 
delete[] array; 
} 


Implementation notes: size, isEmpty, clear 


* These methods are each a single line and need no detailed documentation. 
* Note that size and isEmpty leave the stack unchanged and are therefore 
* marked as const. 


*7 


int CharStack::size() const ( 
return count; 


) 


bool CharStack::isEmpty() const ( 
return count == 0; 


) 


void CharStack::clear() ( 
count = 0; 


Implementation notes: push 


This function first checks to see whether there is enough room for 
the character and then expands the array storage if necessary. 
/ 


j 


void CharStack::push(char ch) { 
if (count -- capacity) expandCapacity(); 
array[count++] = ch; 


Implementation notes: pop, peek 


* These functions check for an empty stack and report an error.if 
there is no top element 
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char CharStack::pop() { 
if (isEmpty()) error("pop: Attempting to pop an empty stack"); 
return array[--count]; 


} 


char CharStack::peek() const { 
if (isEmpty()) error("peek: Attempting to peek at an empty stack"); 
return array[count - 1]; 


Implementation notes: copy constructor and assignment operator 


These methods make it possible to pass a CharStack by value or 
assign one CharStack to another. The actual work is done by the 
private deepCopy method, which represents a useful pattern 

for designing other classes that need to implement deep copying. 





图 12-14 (4) 
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CharStack::CharStack(const CharStack & src) ( 
deepCopy (src); 
} 


CharStack & CharStack::operator-(const CharStack & src) { 
if (this !- &src) ( 
delete[] array; 
deepCopy (src); 


return *this; 


Implementation notes: deepCopy 


This method copies the data from the src parameter into the current 
object. All dynamic memory is reallocated to create a "deep copy 
in which tbe current object and the source object are independent 


void CharStack: :deepCopy (const CharStack 5 src) ( 
array = new char[src.count]; 
for (int i = 0; i « src.count; i++) { 
array[i] = src.array[i]; 


count = src.count; 
capacity - src.capacity; 


Implementation notes: expandCapacity 


This method doubles the capacity of the elements array whenever it ruris 
out of space. To do so, the method must copy the pointer tc the old 
array, allocate a new array with twice the capacity, copy the characters 
from the old array to the new one, and finally free the oid storage 


void CharStack::expandCapacity() ( 
char *oldArray - array; 
capacity *- 2; 
array = new char[capacity]; 
for (int i = 0; i < count; i++) ( 
array[i] = oldArray[i]; 


delete[] oldArray; 





图 12-14 (4) 


12.9 CharStack 类 的 效率 


第 13 章 用 charstack 类 作为 其 中 一 种 可 能 的 实现 策略 来 创建 文本 编辑 器 。 由 于 下 一 
章 的 主要 目标 是 评估 这 些 不 同 策略 的 相对 效率 ， 因 此 就 需要 对 CharStack 类 本 身 的 效率 有 
一 个 理解 。 从 第 10 章 中 就 已 知道 ， 一 个 算法 的 效率 通常 以 它 的 时 间 复 杂 度 表示 ,， 它 测试 随 
着 一 个 函数 问题 规模 的 变化 ， 该 函数 的 运行 时 间 如 何 变化 。 

对 于 CharStack 类 ， 其 中 大 部 分 方法 在 栈 当 前 大 小 情况 下 是 以 常量 时 间 运 行 的 。 事 实 
上 ， 类 内 仅 有 一 个 方法 会 改变 其 栈 的 大 小 。 通 常 ，pusn 方法 仅 将 一 个 字符 压 人 到 其 数组 的 
下 个 空 槽 中， 这 仅 需 要 一 个 常量 时 间 。 然 而 ， 若 这 个 数组 已 满 ,， 则 expandcapacity 方 
法 就 不 得 不 复制 数组 的 内 容 给 新 分 配 的 内 存 ， 这 会 使 得 随 着 栈 的 增 大 ， 程 序 会 运行 得 越 来 越 
慢 。 调 用 expandCapacity 要 求 线性 时 间 ， 它 表明 最 坏 情 况 下 push 方法 的 时 间 复 杂 度 为 
O (N), 

至 此 ， 复 杂 度 分 析 集 中 于 : 在 最 坏 情 况 下 ， 一 个 特定 的 算法 是 如 何 执行 的 。 然 而 ， 这 
里 有 一 个 重要 的 特征 使 得 对 push 操作 的 复杂 度 分 析 不 同 于 传统 的 对 其 他 操作 的 复杂 度 分 
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H: 最 坏 情况 不 可 能 每 次 都 发 生 。 特 别 是 ， 如 果 压 栈 触发 了 一 个 expandCapacity 方 法 的 
调用 ， 而 该 调用 以 O CN) 的 时 间 运 行 ， 则 push 操作 压 入 下 一 项 的 花费 保证 为 O (1)， 因 
为 栈 的 容量 已 经 被 扩展 了 。 因 此 在 整个 push 操作 中 ， 有 必要 平均 分 配 这 个 栈 扩展 的 时 间 代 
价 。 这 种 复杂 度 度量 类 型 被 称 为 分 步 分析 (amortized analysis), 


为 了 使 这 个 过 程 更 易于 理解 ， 计 算 push 操作 重复 V 次 所 花费 的 全 部 时 间 是 很 有 用 的 ， 


这 里 可 以 是 某 个 较 大 值 。 不 管 栈 的 容量 是 否 被 扩充 ， 每 一 个 push 操作 都 会 花费 一 些 时 
间 。 如 果 你 用 希腊 字母 a 表示 固定 成 本 ,那么 压 人 NN 项 的 总 成 本 为 aN。 然 而 ，push 操作 
常常 需要 扩充 栈 中 数组 的 容量 ， 这 是 一 个 花费 固定 时 间 的 线性 操作 (用 和 希腊 字母 RA), 
以 栈 中 字符 数量 的 点 数 。 
关于 NN 次 push 操作 的 总 运行 时 间 ， 最 坏 情况 是 当 循环 后 期 时 才 要 求 栈 扩充 容量 。 此 
时 ， 最 后 的 push 操作 会 导致 BN 的 额外 开销 。 假 定 每 次 expandcapacity 方 法 的 调用 都 
将 使 栈 内 数组 容量 翻 一 番 ， 当 栈 的 容量 为 NN 的 一 半 、X 的 114， 等 等 时 ， 也 必须 被 扩展 ， 则 
push 操作 广 次 的 总 代价 为 下 式 公式 所 示 : 
总 时 间 一 CN+B{N+ 信 + i Aes) 
平均 时 间 就 是 总 时 间 除 以 W， 如 下 式 所 示 : 
平均 时 间 二 a+B IE + I t] 
尽管 圆 括号 内 的 数字 之 和 取决 于 NW， 但 其 和 绝 不 可 能 超过 2， 这 意味 着 平均 时 间 以 常数 
a+26 为 界 ， 它 的 时 间 复 杂 度 为 O (1)。 


本 章 小 结 
本 书 的 目标 之 一 就 是 鼓励 你 使 用 高 级 数据 结构 ， 它 允许 你 以 独立 于 底层 表示 的 抽象 方式 
来 思考 数据 。 抽 象 数据 类 型 和 类 的 使 用 使 得 我 们 能 坚持 这 一 观点 。 同 时 ， 高 效 地 使 用 C++ 
要 求 你 在 头脑 中 有 一 个 数据 结构 在 内 存 中 是 如 何 表示 的 模型 。 本 章 ， 你 有 机 会 去 了 解 这 些 结 
构 是 如 何 被 存储 的 ， 并 获得 你 编写 程序 时 对 “处 于 底层 ”的 认识 。 
本 章 的 重点 如 下 : 
© C++ [JH new 操作 符 和 一 个 类 型 名 从 堆 中 分 配 内 存 ，new 操作 返回 一 个 指向 所 分 配 
的 这 块 足以 存放 该 类 型 值 的 内 存 块 的 首 指针 。 
e 基本 类 型 、 对 象 和 结构 都 可 以 通过 在 类 型 名 前 添 写 new 操作 符 从 而 在 堆 中 被 分 配 内 
存 ， 如 以 下 语句 所 示 : 


int *ip = new int; 


在 动态 分 配对 象 的 情况 下 ,你 也 可 以 在 类 型 名 之 后 指定 其 构造 函数 的 参数 ， 如 以 下 
语句 所 示 : 


Rational *pointerToOneHalf = new Rational(1, 2); 


指针 经 常 被 用 以 指明 一 个 数据 结构 中 各 个 元 素 之 间 的 联系 。 该 技术 一 个 特别 重要 的 
应 用 就 是 链表 ， 在 链表 中 的 指针 形成 了 一 个 线性 链 。 链 表 中 的 每 一 个 元 素 被 称 为 一 
TER ( cell)。 链 表 中 的 最 后 一 个 结 点 包含 了 一 个 NULL 空 指 针 ， 它 标识 着 链表 的 
结束 。 

e 采用 new 操作 符 ， 并 在 类 型 名 后 的 方 括号 内 指明 所 期 望 分 配 的 该 类 型 量 的 个 数 ， 便 
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可 分 配 一 个 所 期 望 容量 的 动态 数组 的 内 存 空间 ， 就 像 以 下 声明 语句 ， 它 分 配 了 一 个 
可 容纳 10 个 字符 大 小 的 动态 数组 : 


char *cp = new char[10]; 


不 像 大 部 分 现代 程序 设计 语言 ，C++ 要 求 程序 员 负 责 内 存 管理 。 程 序 员 所 面临 的 最 

大 挑战 就 是 释放 程序 所 分 配 的 任意 堆 内 存 。 在 底层 中 ，C++ 使 用 aelete 操作 符 释 

放 单 一 的 堆 空 间 ，delete[ ] 操作 符 释放 动态 分 配 的 一 块 内 存 空 间 。 

C++ 的 内 存 管理 任务 通过 析 构 函数 得 到 了 相当 大 的 简化 ， 当 前 栈 帧 所 包含 的 一 个 对 

象 在 调用 方法 返回 时 应 消失 ， 为 此 ， 此 时 系统 会 自动 调用 对 象 所 属 类 的 析 构 函数 。 

析 构 函数 的 主要 任务 是 释放 对 象 所 分 配 的 任意 堆 内 存 。 

析 构 函数 名 是 类 名 前 加 一 个 波浪 符 ~。 每 一 个 类 只 能 有 一 个 无 参 的 析 构 函数 。 

正如 本 章 所 述 的 Charstack 类 ， 可 以 使 用 数组 来 实现 可 动态 扩展 其 容量 的 抽象 数 

据 类 型 。 

ME - 栈 图 有 助 于 理解 C++ 是 如 何 分 配 内 存 的 。 每 一 个 函数 或 方法 调用 都 会 创建 一 个 

栈 帧 ， 包 含 了 自身 声明 的 局 部 变量 只 有 程序 执行 new 操作 才 会 把 内 存 分 配 到 堆 上 。 

仅 当 程序 执行 delete 操作 时 其 所 分 配 的 堆 内 存 才 被 回收 。 当 一 个 函数 返回 时 ， 栈 

内 空间 被 自动 释放 。 

无 论 何 时 你 实现 一 个 供 他 人 使 用 的 类 ， 你 都 有 责任 尽 可 能 彻底 地 测试 它 。 一 个 有 效 

的 技术 就 是 编写 一 个 能 自动 测试 类 中 每 一 个 方法 的 测试 程序 ， 它 应 独立 于 一 个 应 用 

中 的 其 他 模块 。 这 样 的 测试 程序 被 称 为 单元 测试 ， 它 是 好 的 软件 工程 实践 的 一 个 重 

要 部 分 。 

当 你 将 一 个 对 象 赋值 给 另 一 个 对 象 ， 或 者 将 其 值 传递 给 另 一 个 对 象 时 ，C++ 默认 的 

规则 是 进行 对 象 的 浅 找 贝 。 当 一 个 对 象 包 含 动态 分 配 的 内 存 时 ， 通 常 需要 做 深 堵 贝 ， 

深 拷 贝 会 将 指针 所 指向 的 对 象 进行 拷贝 。 

你 可 以 通过 重 载 赋值 操作 符 和 拷贝 构造 函数 来 改变 C++ 拷贝 特定 类 的 对 象 拷贝 方 

法 。 正 确 地 定义 这 些 方法 的 规则 是 十 分 精妙 的 ， 你 应 该 从 一 个 已 存在 的 类 中 拷贝 其 

基本 结构 ， 然 后 再 修改 必要 的 代码 。 

你 可 以 通过 在 类 的 私有 部 分 重 载 赋值 操作 符 和 拷贝 构造 函数 来 共同 禁止 对 象 拷贝 。 

* const XEFE C++ 程序 中 有 不 同 的 应 用 。 除 了 定义 常量 值 ， 你 可 以 使 用 const 
指定 一 个 方法 ， 它 不 能 改变 特定 的 参数 值 或 者 是 对 象 的 值 。 

e 即使 Charstack 类 中 的 push 方法 有 时 要 求 以 O_ CN) 的 时 间 来 扩展 动态 数组 的 容 

量 ， 但 这 个 时 间 代 价 不 会 连续 多 次 发 生 。 事 实 上 ， 这 个 时 间 代 价 被 分 配给 方法 的 每 

一 次 调用 中 。 使 用 这 种 分 步 分 析 的 方法 ，charstack 类 中 的 每 个 方法 都 以 O (1) 

时 间 运 行 。 


复习 题 


1. 本 章 所 描述 的 三 种 内 存 分 配 机 制 是 什么 ? 

2. 什么 是 堆 ? 

3. 为 什么 堆 和 栈 在 内 存 的 末端 以 相反 的 方向 扩展 ? 

4. 为 了 创建 和 初始 化 下 面 的 变量 ， 你 应 该 使 用 什么 声明 ? 
a) 一 个 指向 布尔 值 的 bp 指针 。 
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b) 一 个 名 为 pp 的 指针 变量 ， 指 向 坐标 为 (3，4 ) 的 一 个 Point MR. 
c) 能 容纳 100 个 C++ 字符 串 的 动态 数组 names. 
5. 你 应 该 使 用 什么 语句 来 释放 在 前 面 习题 中 分 配 的 内 存 ? 
6. 定义 在 数据 结构 中 使 用 的 链表 中 的 术语 结 点 和 链接 。 
7. 什么 是 标记 链表 结束 的 标准 方法 ? 
8. 什么 样 的 数据 结构 可 使 你 定义 整 型 链表 ? 
9. 假设 你 已 有 了 一 个 整 型 链表 的 定义 ， 应 该 如 何 编写 for 循环 ， 以 单 步调 试 链表 list 中 的 每 一 个 元 素 ? 
10. 什么 是 内 春 泄 漏 ? 
11. 判断 题 :， C++ 使 用 垃圾 回收 来 管理 内 存 。 
12. 什么 是 析 构 函数 ? 它 最 重要 的 角色 是 什么 ? 
13. 如 果 你 创建 一 个 名 为 IntArray 的 类 ， 如 何 编写 它 的 析 构 函数 原型 ? 
14. 变量 越界 意味 着 什么 ? 
15. 判断 题 ， 析 构 函 数 甚至 可 以 被 没有 赋 给 局 部 变量 的 临时 变量 调用 。 
16. 如 何 使 动态 扩展 CharStack 类 的 容量 成 为 可 能 ， 即 使 它 使 用 的 数组 大 小 在 分 配 时 已 经 确定 ? 562 
17. 描述 charstack 类 中 每 一 个 实例 变量 的 目的 。 
18. 解释 图 12-8 中 expandCapacity 类 实现 中 的 每 一 条 语句 。 
19. 假设 ， expandCapacity 类 只 需要 给 其 数组 增加 一 个 元 素 ， 而 不 是 将 数组 的 容量 翻 一 番 。 Push 
方法 的 平均 时 间 复 杂 度 仍 是 O (1 ) 吗 ? 为 什么 是 或 者 不 是 ? 
20. 新 的 内 存 什么 时 候 被 加 到 堆 - 栈 图 中 栈 的 那 一 边 ? 内 存 什么 时 候 被 回收 ? 
21. 新 的 内 存 什 么 时 候 被 加 到 堆 - 栈 图 中 堆 的 那 一 边 ? 内 存 什 么 时 候 被 回收 ? 
22. 本 章 在 堆 — 栈 图 中 给 出 开销 (overhand) 这 一 术语 的 原因 是 什么 ? 
23. 在 堆 - 栈 图 中 ， 你 如 何 表示 引用 参数 ? 
24. 当 你 调用 类 的 一 个 方法 而 不 是 调用 一 个 普通 函数 时 ， 哪 些 额外 的 信息 会 加 入 到 当前 的 栈 帧 结构 中 ? 
25. 在 术语 单元 测试 中 单元 喻 指 什么 ? 
26. RH NARA A fa AN TA]? C++ 默认 使 用 这 两 种 策略 中 的 哪 一 个 ? 
27. 为 了 改变 C++ 拷贝 对 象 的 方式 ， 你 必须 重 载 哪些 方法 ? 
28. 常量 引用 调用 为 什么 与 大 部 分 之 前 所 熟悉 的 值 调用 和 引用 调用 的 参数 传递 方式 不 同 ? 
29. 对 类 而 言 ， 常 量 正确 的 意味 着 什么 ? 
30. push 操作 的 分 步 复杂 度 是 O ( 1 ) 的 论据 依赖 于 这 一 系列 数字 之 和 : 


1 1 1 
14+—4+—4+—} = 
2 4 8 
无 论 你 包含 多 少 步 ， 和 不 会 超过 2。 试 着 用 你 自己 的 话 解释 为 什么 。( 如 果 遇 到 困难 ， 可 以 试 着 在 
网 上 查找 世 诺 导论 (Zeno’s Paradox )， 然 后 基于 此 理论 给 出 你 的 解释 。) 563 
习题 
1. 编写 一 个 createIndexArray (n) 函数 ， 它 动态 分 配 可 存储 n 个 整数 的 数组 ， 数 组 中 的 每 个 元 素 


值 被 初始 化 为 其 下 标 值 。 例 如 ,调用 createIndexArray (8) 应 该 返回 一 个 指向 堆 中 数组 的 指 
针 ， 如 下 图 所 示 : 





ü ! 2 3 4 5 ^ 7 


2. FE 11.4.3 小 节 的 stropy EXP, ARAL Pb be ICA ON T Sex Tr RUE AS. FEL, 
这 个 危险 项 就 是 stropy 没有 检查 字符 数组 收 到 拷贝 后 是 否 还 有 有 效 的 存储 空间 。 因 此 它 增 加 了 数 
组 越界 故障 的 概率 。 然 而 ， 如 果 可 能 的 话 ， 采 用 动态 分 配 以 创建 用 于 拷贝 字符 串 所 需 的 内 存 空 间 以 
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避免 上 述 危 险 。 
编写 一 个 函数 : 
char *copyCString(char *str) ; 


它 可 以 为 C 风格 的 str 字符 串 分 配 足够 大 的 内 存 ， 并 且 将 结束 字符 在 内 的 所 有 字符 复制 到 新 分 配 的 
内 存 中 。 

.在 图 12-3 刚 铎 的 灯塔 程序 中 ,灯塔 的 名 字 被 明确 地 列 在 CreatBeaconsOfGondor 函数 中 。 一 种 
更 灵活 的 方式 是 从 数据 文件 中 读 取 灯 塔 的 名 字 。 修 改 BeaconsofGondor 程序 ， 以 便 在 主 程序 的 
第 一 条 语句 中 调用 以 下 函数: 

Tower *readBeaconsFromFile(string filename); 


该 函数 从 特定 的 文件 中 读 取 灯塔 列表 。 例 如 ， 如 果 文 件 BeaconofGondor.txt 包含 下 图 所 示 的 灯 
塔 列表 名 ， 则 这 个 程序 会 像 本 章 之 前 描述 的 那样 运行 。 
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.设计 和 实现 一 个 名 为 IntArray 的 类 ， 并 实现 以 下 类 中 的 方法 : 
e 创建 一 个 包含 n 个 元 素 对 象 的 构造 函数 Intarray (n) ， 并 且 将 每 个 元 素 都 初始 化 为 0。 
e 释放 由 IntArray 类 所 分 配 的 任意 堆 内 存 的 析 构 函数 。 
e 一 个 返回 IntArray 中 元 素 个 数 的 方法 size ()。 
e 一 个 返回 下 标 k 的 元 素 方 法 get (k) 。 如 果 k 已 在 动态 数组 中 越界 ， 则 get 方法 会 调用 error 
方法 ， 并 产生 相应 错误 提示 消息 。 
一 个 给 下 标 为 k 的 元 素 赋 值 的 方法 put (k, value)。 和 get 方法 一 样 ， 若 k 越界 ， 则 方法 put 
就 会 调用 error 方法 。 
你 的 解决 办 法 应 该 用 与 本 章 CharStack 例子 相似 的 方式 ,分开 接 口 和 实现 文件 。 在 初始 的 代码 版 
本 中 ， 你 应 该 给 intarray.h 文件 增加 必要 的 定义 ， 以 防止 用 户 拷 贝 IntArray 对 象 。 设 计 和 实 
现 一 个 单元 测试 以 检测 类 的 方法 。 
通过 跟踪 数组 的 大 小 即 检查 数组 边界 内 的 数组 索引 值 ， 这 个 简单 的 Intarray 类 已 经 解决 了 内 置 数 
组 类 型 的 两 个 最 严重 的 缺陷 。 
5. 你 可 以 通过 重 载 括号 选择 操作 符 ， 会 使 前 面 习题 中 的 IntArray 类 有 点 像 普通 的 数组 ， 该 重 载 函数 
具有 以 下 原型 : 


int & operator[] (int k); 


类 似 get Al put 方法 ， 你 的 operator[] 实现 应 该 进行 越界 检查 ， 以 确保 索引 k 是 有 效 的 。 若 k 
ARM, operator[] 方法 应 该 返回 k 所 指 的 元 素 ， 便 于 用 户 可 以 将 一 个 新 值 放 人 到 下 标 为 k 的 数组 
元 素 位 置 上 。 

6. 为 出 现在 习题 4 和 习题 5 中 的 IntArray 实现 深 拷 贝 。 

7. 假设 你 有 一 个 包含 图 12-15 中 代码 的 文件 。 在 initPair 函数 返回 之 前 ， 画 一 个 表示 内 存 内 容 的 
堆 一 栈 图 。 做 一 个 额外 的 练习 ， 画 这 个 图 的 两 个 版 本 : 一 个 用 明确 的 地 址 ; 另 一 个 用 箭头 表示 指针 。 

8. 就 像 前 面 的 习题 ， 图 12-16 画 了 一 个 表示 内 存 现状 的 堆 一 栈 图 ， 它 要 求 你 画 出 第 二 次 调用 构造 函数 
期 间 的 内 存 变 化 。 
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struct Domino { 
int leftDots; 
int rightDots; 


}; 
void initPair (Domino list[], Domino & dom); 


int main() ( 
Domino onetwo; 
onetwo.leftDots - 1; 
onetwo.rightDots - 2; 
Domino *array = new Domino[2]; 
- initPair(array, onetwo); 
return 0; 


) 


void initPair(Domino list[], Domino & dom) ( 
list[0] = dom; 
list[1].leftDots - dom.rightDots; 
list[1].rightDots - dom.leftDots; 


dom = list[1]; ; — : 
} «€- Diagram memory at this point in the execution 





Fd 12-15 习题 7 中 使 用 的 多 米 诺 骨 牌 程序 的 代码 


class Student { 
public: 


Student() { 
id - 0; 
gpa = 4.0; 

) 


Student(int id, double gpa) ( 
this-»id = id; 


this->gpa = gpa; . z r 
) SP ' & Diagram at this point on the second call to the constructor 


private: 


int id; 
double gpa; 


}; 


int main() { 
Student *advisees = new Student [2]; 
advisees[0] = Student(2718281, 3.61); 
advisees[1] = Student(3141592, 4.2); 
return 0; 


) 





图 12-16 习题 8 中 使 用 Student 类 的 代码 566 


9. 尽管 程序 员 倾向 于 把 字符 串 看 作为 相对 简单 的 实体 ， 但 它们 的 实现 涉及 了 本 章 中 你 所 见 过 的 所 有 方 
法 。 在 本 题 中 ， 你 的 任务 是 定义 一 个 叫做 MyString 的 类 ， 它 近似 于 标准 C++ 类 库 中 的 string 
类 。 你 的 类 应 具有 以 下 公有 方法 : 

e 构造 函数 MySstring(str) 从 CH ff) string 类 中 创建 了 一 个 MyString WR. 

。 一 个 释放 MyString 分 配 的 任 一 堆 空间 的 析 构 函数 。 

e 一 个 将 MyString 类 型 转变 为 C++ 中 的 string 类 型 的 tostring() 方法 。 

© 一 个 返回 字符 串 中 字符 数量 的 方法 Length () 。 

e 一 个 返回 当前 字符 串 对 象 的 子 串 的 方法 substr (start,n)。 无 论 哪 种 情况 先 发 生 ， 它 的 功能 
和 string 类 的 库 版 本 一 样 ， 子 串 要 么 是 以 下 标 start 处 开始 的 n 个 字符 ， 或 者 是 到 字符 串 末 
尾 的 字符 串 。 参 数 n 应 该 是 可 选 的 ;如果 没有 参数 n， 子 串 应 该 总 是 从 start 至 字符 串 的 尾 端 。 

e 重新 定义 + 操作 符 以 连接 两 个 Mystring HR. ERRER += 也 很 有 意义 ， 它 将 一 个 字符 或 字 
符 串 附加 到 另 一 个 字符 串 的 后 面 。 
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重新 定义 << 操作 符 以 将 MyString 类 的 对 象 写 到 输出 流 中 。 

重新 定义 括号 选择 操作 符 (与 习题 5 中 描述 的 一 样 )， 通 过 引用 将 str 中 下 标 i 的 字符 返回 。 随 
着 C++ 类 库 中 stzing 类 的 完善 ， 如 果 在 下 标 选 择 符 的 实现 中 出 现 了 下 标 越 界 ， 那 么 应 该 调用 
Grror 方法 。 

重新 定义 关系 操作 符 ==、!=、<、<=、> 和 >=， 用 于 比较 字符 串 的 字母 顺序 。 

为 MyString 类 重新 定义 一 个 赋值 操作 符 和 拷贝 构造 函数 ， 以 便 任何 拷贝 操作 都 能 对 一 个 新 创 
建 字符 数组 的 实行 深 拷贝 。 

你 的 代码 应 该 采用 你 自己 的 内 在 表示 ， 而 不 能 调用 C++ 语言 string 类 中 的 任何 方法 。 你 的 接口 


和 实现 也 应 该 是 常量 正确 的 ， 以 便 用 户 和 C++ 编译 器 都 能 确切 地 知道 哪些 方法 能 够 改变 字符 串 的 
内 容 。 


.习题 9 作为 MyString 类 的 初步 测试 ， 重 写 3.6 节 图 3-2 中 的 儿童 黑 话 程序 ， 以 便 它 使 用 MyString 


类 代替 string 类 。 


.前面 习 题 中 的 儿童 黑 话 程序 不 是 MyString 类 的 充分 测试 。 设 计 和 实现 一 个 Mystring 类 的 更 彻 


底 的 单元 测试 。 


.为 63 节 介 绍 的 Rational 类 编写 一 个 单元 测试 。 如 果 你 实现 了 第 6 章 习 题 8 中 描述 的 Rational 


类 的 扩展 版 本 ， 那 你 应 该 在 你 的 单元 测试 中 也 应 包含 对 这 些 扩展 的 测试 。 


13. 重 写 rational.h 和 rational.cpp 文件 ,使 得 Rational 类 是 常量 正确 的 。 
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Programming Abstractions in C++ 


效率 和 表示 


完成 一 件 事 所 允许 的 时 间 与 可 充分 利用 的 时 间 并 非 一 定 吻 合 a 
— #4 ARA, COAR )Silences), 1965 


本 章 要 将 数据 结构 的 设计 以 及 算法 效率 这 两 个 看 似 毫 不 相关 的 概念 联系 到 一 起 。 迄 今 
止 ， 对 效率 的 讨论 主要 聚焦 于 算法 。 如 果 选 择 一 个 更 高 效 的 算法 ， 你 可 以 大 大 减少 程序 的 运 
行 时 间 ， 尤 其 是 在 较为 复杂 的 类 中 使 用 新 的 算法 。 然 而 ， 在 某 些 例子 中 ， 为 类 选择 一 个 不 同 
的 底层 表示 可 达到 同样 奇妙 的 效果 。 为 了 阐述 这 一 观点 ， 本 章 将 展示 一 个 特定 类 的 几 种 不 同 
表示 ， 然 后 对 比 这 些 表示 的 效率 。 


13.1 编辑 文本 的 软件 模式 


在 这 个 手机 广泛 使 用 的 时 代 ， 文 本 已 经 变 成 了 最 主流 的 交流 形式 。 你 可 以 在 手机 按键 上 
编辑 信息 并 发 送 给 你 的 一 个 或 多 个 好 友 ， 然 后 他 们 就 可 以 在 自己 的 手机 上 阅读 信息 。 现 在 的 
手机 需要 大 量 的 软件 ， 具 有 代表 性 的 是 那些 几 百 万 行 代码 的 软件 。 为 了 管理 这 种 级 别 的 程序 
复杂 性 ， 将 软件 的 实现 分 为 几 个 可 以 独立 开发 和 管理 的 模块 是 非常 必要 的 。 此 外 ， 这 对 于 使 
用 已 经 完备 的 软件 模式 来 简化 实现 的 过 程 也 是 很 有 用 的 。 

为 了 对 模式 的 有 效 性 有 一 个 认 知 ， 可 以 考虑 我 们 平时 在 手机 上 发 信息 时 会 发 生 什 么 事 
情 。 首 先 你 要 在 手机 键盘 上 输入 你 要 输入 的 文字 ， 当 然 也 包括 编辑 键 。 根 据 不 同 的 手机 类 
型 ， 手机 键盘 也 可 以 分 为 不 同形 式 。 在 较 老式 的 手机 上 ， 键盘 主要 由 一 系列 的 数字 键 组 成 。 
在 这 些 数字 键 上 ， 可 以 通过 按 同 一 键 不 同 次 数 来 选择 你 所 需要 的 字母 。 智 能 手机 可 能 就 没有 
所 谓 的 物理 学 意义 上 的 键盘 了 ， 它 们 用 触摸 屏 上 的 一 些 虚拟 的 键 代 替 了 键盘 。 在 任何 一 种 情 
况 下 ， 都 存在 一 种 概念 意义 上 的 键盘 允许 你 编辑 信息 。 手 机 还 有 一 个 显示 屏 ， 人 允许 我 们 查看 
所 写 人 的 信息 。 然 而 ， 在 任何 现代 设计 中 ,还 有 一 个 对 作为 用 户 的 你 来 说 不 可 见 的 第 三 个 构 
件 。 在 手机 键盘 和 显示 屏 之 间 有 一 个 抽象 的 数据 结构 ， 我 们 用 它 来 记录 当前 的 信息 内 容 。 手 
机 键盘 会 更 新 这 个 数据 结构 的 内 容 ， 其 内 容 会 在 显示 屏 上 显示 出 来 。 

上 一 段 讲 的 三 部 件 分 解 方法 是 一 个 很 重要 的 设计 策略 实例 。 这 个 分 解 策略 称 为 模型 - 视 
-控制 器 ( model-view-controllr, MVC) 模式 。 在 手机 这 个 例子 中 ， 键 盘 代 表 控 制 器 ， 
显示 屏 代 表 视 图 ， 底 层 的 数据 结构 代表 模型 。 这 种 手机 示例 的 实现 如 图 13-1 所 示 ， 这 个 图 
跟踪 了 不 同 模块 之 间 的 信息 流向 。 

如 图 13-1 所 示 ， 当 你 用 手机 发 送 短信 时 ， 你 正在 使 用 编辑 器 (editor) 。 编 辑 器 是 一 个 支 
持 创建 和 修改 文本 数据 的 软件 模块 。 在 很 多 应 用 中 ,我们 都 要 用 到 编辑 器 。 当 你 需要 在 一 个 
基于 Web 的 表单 中 输入 信息 或 者 在 你 的 开发 环境 中 创建 一 个 C++ 程序 时 ， 你 就 在 使 用 一 个 
编辑 器 。 现 在 大 多 数 编辑 器 都 采用 模型 - 视图 - 控制 器 模式 。 在 模型 内 部 ， 一 个 编辑 器 可 以 
包含 一 系列 的 字符 ， 这 通常 称 为 缓冲 区 (buffer)。 控 制 器 允许 用 户 在 缓冲 区 的 内 容 里 进行 各 
种 操作 ， 其 中 很 多 操作 仅 限 于 缓冲 区 的 当前 位 置 。 这 个 位 置 在 显示 屏 上 用 一 个 光标 〈 cursor) 
符号 表示 ， 它 主要 在 两 个 字 中 间 以 垂直 线 的 形式 出 现 。 
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视图 





Mr. Watson, come 

here. | want to see 

Mr. Watson, come here. 
| want to see you. 








控制 器 
图 13-1 使 用 模型 -视图 - 控制 器 模式 分 解 的 手机 
虽然 编辑 器 应 用 的 控制 器 和 视图 构件 面临 比较 有 趣 的 编程 挑战 ， 但 本 章 重 点 研究 构成 模 
型 的 编辑 器 缓冲 区 。 编 辑 器 应 用 的 效率 对 你 选择 用 来 表现 缓冲 区 的 数据 结构 是 特别 敏感 的 。 
本 章 会 用 三 种 不 同 的 底层 表示 (一 个 字符 数组 、 一 对 字符 栈 ， 以 及 一 个 字符 链表 ) 实现 对 编 
辑 器 缓冲 区 的 抽象 ， 并 且 评 估 它 们 各 自 的 优 缺 点 。 


13.2 设计 简单 的 文本 编辑 器 


现代 的 编辑 器 提供 了 一 种 高 度 完 备 的 编辑 环境 ， 而 且 有 一 些 别致 的 特性 使 其 更 加 完善 。 
比如 使 用 鼠标 来 定位 光标 ， 或 者 用 命令 搜寻 特定 字符 串 文 本 。 此 外 ， 它 们 趋向 于 使 所 有 的 编 
辑 命令 的 操作 结果 可 以 和 期 望 的 相同 。 那 些 在 编辑 过 程 中 可 以 始终 显示 当前 缓冲 区 内 容 的 
编辑 器 称 为 所 见 即 所 得 (wysiwyg， 英 文 读 作 “wizzy-wig”) 编辑 器 ， 它 是 “what you see is 
what you get” 的 首 字母 缩写 词 。 这 种 编辑 器 易于 使 用 ， 但 是 所 有 那些 高 级 特性 也 让 我 们 很 
难看 到 编辑 器 内 部 是 如 何 工作 的 。 

在 计算 的 早期 时 代 ， 编 辑 器 相对 简单 。 没 有 鼠标 也 没有 完备 的 图 形 显示 器 ， 编 辑 器 用 
来 对 在 键盘 上 输入 的 指令 做 出 回应 。 例 如 ， 对 于 一 个 基于 键盘 的 典型 编辑 器 ， 你 需要 敲 击 
命令 字母 工 外 加 一 系列 有 序 文字 来 插 和 人 新 的 文本 。 附 加 的 命令 完成 其 他 的 编辑 功能 ， 例 如 
将 光标 在 缓冲 区 中 移动 。 通 过 输入 正确 的 命令 ,你 可 以 实现 你 所 期 望 的 任何 文本 编辑 。 考 
虑 到 本 章 的 重点 是 编辑 器 缓冲 区 的 表示 ， 而 不 是 支持 一 个 更 完备 的 编辑 环境 的 必要 高 级 特 
性 ， 我 们 有 必要 以 这 种 命令 驱动 形式 的 方法 探究 缓冲 区 的 抽象 。 一 旦 你 完成 了 对 编辑 器 组 
冲 区 的 抽象 实现 ， 你 就 可 以 返回 并 将 它 合 并 为 一 个 基于 模型 - 视图 - 控制 器 模式 的 更 完备 
的 应 用 。 


13.2.1 编辑 器 命令 


接 下 来 的 几 小 节 将 展示 一 个 极其 简单 的 编辑 器 的 开发 过 程 。 这 个 编辑 器 可 以 执行 表 13-1 
中 所 示 的 命令 。 除 了 可 以 获取 所 要 插入 字符 的 工 命令 之 外 ， 每 一 条 编辑 器 命令 都 由 一 行 上 的 
单个 字母 组 成。 
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表 13-1 一 个 基于 命令 的 简单 编辑 器 的 可 用 命令 





F 将 编辑 光标 向 前 移动 一 个 字符 
B 将 编辑 光标 向 后 移动 一 个 字符 
J 跳 转 至 缓冲 区 的 开始 
E 将 光标 移 至 缓冲 区 的 末尾 
Ixxx 在 当前 光标 位 置 插 入 字符 串 xxx 
D 删除 当前 光标 位 置 之 后 的 字符 
H 输出 所 列 出 命令 的 帮助 信息 
Q 退出 编辑 器 程序 
下 面 运行 的 例子 阐述 了 这 个 基于 命令 的 编辑 器 的 操作 ， 以 及 用 来 描述 每 个 操作 的 文字 注 
释 。 在 这 种 情况 下 ， 用 户 首 先 插入 字符 axc， 然 后 将 缓冲 区 的 内 容 改 为 abc。 
(OOO  .- . SimplTextditr — ^ . 






*Iaxc This command inserts the characters a, b, and c into 
| axec the buffer. leaving the cursor at the end. 
^ 


| «7 This command moves the cursor to the beginning. 
axc 
^ 
*F This command moves the cursor forward one character. 
axc 
*D This command deletes the x. 
ac 
A 
*Ib This command inserts a b. 
abc 
~ 
a 
* 
zi 
I jar 


编辑 器 程序 显示 了 执行 完 每 个 命令 之 后 缓冲 区 的 状态 。 从 运行 的 程序 结果 来 看 ， 程 序 用 下 一 
行 的 插入 符 号 (C^) 标识 了 光标 的 位 置 。 在 真实 的 编辑 器 中 这 种 行为 是 你 不 想 看 到 的 ， 但 它 
可 以 让 我 们 很 清晰 地 看 到 程序 到 底 是 如 何 运行 的 。 

在 像 C++ 这 样 的 面向 对 象 语言 中 ， 定 义 一 个 类 来 表示 编辑 器 缓冲 区 是 很 合理 的 。 在 
这 里 使 用 类 的 优点 就 是 它 允 许 你 将 行为 和 表示 分 开 。 因 为 你 理解 了 它 必 须 响应 的 操作 ， 所 
以 你 就 早已 经 知道 了 一 个 编辑 器 缓冲 区 的 行为 。 在 buffer.h 接 口中 ， 可 以 定义 一 个 
EditorBuffer 类 ， 它 的 公有 接口 提供 了 所 需要 的 操作 集 ， 而 它 的 数据 表示 是 私有 的 。 用 
户 可 完全 通过 EditorBuffer 对 象 的 公有 接口 而 不 必 访问 其 底层 的 数据 表示 就 对 其 进行 操 
作 。 这 样 反 过 来 可 以 让 我 们 自由 地 改变 数据 的 表示 形式 而 无 须 修改 用 户 程序 。 


13.2.2 EditorBuffer 类 的 公有 接口 


公有 接口 由 一 系列 原型 化 的 方法 构成 ， 这 些 方法 实现 了 编辑 器 缓冲 区 的 基本 操作 。 你 需 
要 定义 哪些 操作 ? 如 果 没 有 特别 的 要 求 ， 你 需要 为 下 面 的 6 个 编辑 器 命令 定义 方法 。 然 而 ， 
就 像 类 一 样 ， 你 需要 定义 一 个 构造 函数 以 允许 你 初始 化 一 个 新 的 缓冲 区 。 由 于 这 个 类 名 为 
EditorBuffer， 因 此 它 的 构造 函数 的 原型 为 : 


EditorBuffer(); 
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^EditorBuffer(); 


它 可 以 撤消 分 配给 EditorBuffer 对 象 的 任何 堆 存 储 空 间 。 

处 理 完 这 些 细节 以 后 ， 下 一 步 就 是 定义 与 编辑 器 命令 相对 应 的 方法 。 例 如 ， 将 光标 向 前 
移动 ， 可 以 定义 如 下 方法 : 

void moveCursorForward(); 
在 设计 一 个 接口 时 ， 你 不 用 关注 这 个 操作 是 如 何 实现 的 ， 或 者 缓冲 区 和 它 的 光标 是 如 何 表示 
的 ， 牢 记 这 一 点 十 分 重要 。moveCcursorEorwarda 方法 完全 是 由 其 抽象 效果 定义 的 。 

除了 实现 编辑 器 命令 的 方法 之 外 ， 编 辑 器 应 用 程序 必须 能 够 显示 缓冲 区 的 内 容 ， 这 也 包 
括 光 标的 位 置 。 为 了 使 这 些 操作 可 行 ，EditorBuffer 类 具有 以 下 公有 方法 : 


string toString() const; 
它 以 C++ 字符 串 形 式 返回 当前 整个 缓冲 区 的 内 容 ， 同 时 ， 以 下 方法 : 
int getCursor() const; 


以 数字 0 与 缓冲 区 长 度 之 间 的 一 个 整数 形式 返回 当前 光标 的 位 置 。 这 些 方法 并 不 改变 缓冲 区 
的 内 容 ， 因 此 用 const 关键 字 来 标记 它们 是 一 个 很 好 的 实践 。 

editorbuffer.h 接口 的 内 容 显示 在 图 13-2 中 。 正 如 在 第 12 章 所 列 出 的 接口 ， 
EditorBuffer 类 的 私有 部 分 看 起 来 像 一 个 蓝 色 的 空 盒子 。 它 将 基于 不 同 的 缓冲 区 数据 表 
示 策 略 而 用 不 同 的 定义 填 满 。 


/* 
* File: buffer.h 
* 


* This file defines the interface for the EditorBuffer class. 
*f 


#ifndef buffer h 
#define buffer h 


/* 
* Class: EditorBuffer 


* This class represents an editor buffer, which maintains an ordered 
* sequence of characters along with an insertion point called the cursor. 


Sg 
class EditorBuffer { 
public: 
Constructor: EditorBuffer 
Usage; EditorBuffer buffer; 


Creates an empty editor buffer. 
*f 


EditorBuffer(); 


/* 


* Destructor: -EditorBuffer 
* 


* Prees any heap storage associated with this buffer. 


af 
~EditorBuffer () ; 





图 13-2 编辑 器 缓冲 区 抽象 的 接口 
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Methods: moveCursorForward, moveCursorBackward 
Usage: buffer.moveCursorForward () ; 
buf fer.moveCursorBackward () ; 


Moves the cursor forward or backward one character. If the command 
would shift the cursor beyond either end of the buffer, this method 
has no effect. 


void moveCursorForward () ; 
void moveCursorBackward () ; 


* Methods: moveCursorToStart, moveCursorToEnd 
* Usage: buffer.moveCursorToStart(); 
buffer.moveCursorToEnd(); 


Moves the cursor to the start or the end of this buffer. 


ay 


void moveCursorToStart () ; 
void moveCursorToEnd () ; 


* Method: insertCharacter 
Usage: buffer.insertCharacter (ch) ; 


Inserts the character ch into this buffer at the cursor position, 
leaving the cursor after the inserted character. 


void insertCharacter(char ch); 


* Method: deleteCharacter 
Usage: buffer.deleteCharacter () ; 


Deletes the character immediately after the cursor, if any 


void deleteCharacter(); 


Method: getText 


* Usage: string str buffer.getText(); 
* 


* Returns the contents of the buffer as a string. 


*/ 
std::string getText() const; 
Method: getCursor 


Usage: int cursor buffer.getCursor(); 


Returns the index of the cursor. 


my 


int getCursor() const; 


The private section of the class goes here. 


The implementation of the class goes here. 


#endif 





图 13-2 ( 续 ) 


13.2.8 选择 一 种 底层 表示 


甚至 到 这 一 步 ， 你 可 能 对 哪 种 内 部 数据 结构 表示 更 适合 这 个 类 有 自己 的 想法 。 因 为 
这 个 缓冲 区 包含 一 个 有 序 的 字符 序列 ， 一 个 更 有 可 能 的 主观 选择 就 是 采用 string MA 
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Vector<char> 类 作为 它 的 底层 表示 。 只 要 你 的 运行 环境 提供 这 些 类 ， 那 么 选择 它们 中 的 
任 一 个 都 是 一 种 不 错 的 底层 表示 。 然 而 ， 本 章 的 目的 是 研究 表示 方式 的 选择 如 何 影响 应 用 程 
序 的 效率 。 如 果 程 序 使 用 了 string 或 者 Vector<char> 这 些 高 级 的 数据 结构 ， 理 解 这 一 
点 就 会 更 困难 。 因 为 这 些 类 的 内 部 工作 对 于 用 户 来 说 是 不 可 见 的 。 如 果 你 采用 相反 的 方式 使 
用 内 置 的 数据 结构 来 限制 你 的 实现 ， 那 么 每 个 操作 就 都 变 为 可 见 了 。 因 此 ， 你 就 可 以 比较 容 
易 鉴 别 不 同 的 底层 表示 方式 的 效率 。 逻 辑 表 明 使 用 一 个 字符 数组 作为 底层 表示 ， 因 为 数组 操 
作 不 会 隐藏 其 时 空 开销 。 

尽管 使 用 数组 表达 缓冲 区 是 一 个 相对 合理 的 方法 ， 但 同时 也 存在 其 他 的 表示 ， 并 且 它 
们 可 能 更 有 意思 。 本 章 的 基础 出 发 点 (甚至 是 本 书 的 重点 ) 是 你 不 能 草率 地 确定 一 种 特定 的 
表示 方式 。 在 这 个 编辑 器 缓冲 区 例子 中 ， 数 组 只 是 其 中 一 种 可 选 方案 ， 每 一 种 可 选 方案 都 有 
它 的 优 缺 点 。 通 过 权衡 各 种 方案 ， 你 可 能 会 在 一 系列 特定 的 环境 下 选择 某 种 策略 ， 然 后 在 
其 他 环境 中 选择 别 的 方案 。 与 此 同时 ， 你 要 注意 到 : 不 管 选择 哪 种 表示 ， 编 辑 器 必须 能 够 实 
现 完全 相同 的 命令 集 。 因 此 ， 即 使 底层 表示 有 所 改变 ， 编 辑 器 缓冲 区 的 外 部 行为 也 必须 保持 
一 致 s 


13.2.4 ”编写 编辑 器 应 用 代码 


一 旦 定义 完 公 有 接口 ， 即 使 你 还 没有 实现 缓冲 区 类 或 者 还 没有 确定 一 个 适合 的 内 部 表 
示 ， 你 也 可 以 编写 编辑 器 应 用 程序 了 。 编 写 编辑 器 应 用 时 ， 你 最 需要 考虑 的 就 是 每 个 操作 都 
干 了 什么 。 从 这 一 层面 上 来 看 ， 实 现 细节 并 不 重要 。 
只 要 你 使 用 表 13-1 所 示 的 命令 ， 编 写 编辑 器 程序 就 会 相对 简单 。 这 个 程序 简单 地 创建 
了 一 个 新 的 EditorBuffer 对 象 ， 然 后 进入 一 个 循环 ， 在 该 循环 中 ， 程 序 读 取 一 系列 的 编 
辑 器 命令 。 只 要 用 户 输入 一 个 命令 ， 程 序 就 会 查看 这 个 命令 的 第 一 个 字母 ， 然 后 通过 调用 组 
[577 冲 区 接口 的 适当 方法 执行 请 求 的 命令 。 基 于 命令 的 编辑 器 的 代码 如 图 13-3 所 示 。 


/* 
* File: SimpleTextEditor.cpp 
* 


* This program implements a simple command-driven text editor, which is 


* used to test the EditorBuffer class. 
af 


#ainclude <cctype> 

#include <iostream> 
#include "buffer.h" 
#include "foreach.h" 
#include "simpio.h" 
using namespace std; 


/* Function protetypes */ 


void executeCommand(EditorBuffer & buffer, string line); 
void displayBuffer (EditorBuffer & buffer); 
void printHelpText (); 


int main() ( 
EditorBuffer buffer; 
while (true) ( 
string cmd - getLine("*"); 
if (cmd !- "") executeCommand(buffer, cmd); 


return 0; 





图 13-3 测试 EditorBuffer 类 的 简单 文本 编辑 器 


ACER e 































[* 
* Function: executeCommand 

* Usage: executeCommand(buffer, line); 

d euxece AIL pua AL cng uu GRE SE ELEC I ate M gi 

* Executes the command specified by line on the editor buffer. 
wf 


void executeCommand(EditorBuffer & buffer, string line) { 
switch (toupper(line[0])) ( 
case 'I': for (int i = 1; i « line.length(); i++) { 
buffer.insertCharacter(line[i]); 

) 

displayBuffer (buffer); 

break; 
case 'D': buffer.deleteCharacter(); displayBuffer(buffer); break; 
case 'F': buffer.moveCursorForward(); displayBuffer(buffer); break; 
case 'B': buffer.moveCursorBackward(); displayBuffer(buffer); break; 
case 'J': buffer.moveCursorToStart(); displayBuffer(buffer); break; 
case 'E': buffer.moveCursorToEnd(); displayBuffer(buffer); break; 
case 'H': printHelpText(); break; 
case 'Q': exit(0); 
default: cout «« "Illegal command" «« endl; break; 


* Function: displayBuffer 
* Usage: displayBuffer (buffer); 


* Displays the state of the buffer including the position of the cursor. 
xf 








void displayBuffer (EditorBuffer & buffer) 
string str = buffer.getText () ; 
for (int i = 0; i < str.length(); i++) { 
cout << " n << str[i]; 


{ 


} 
cout << endl; 
cout << string(2 * buffer.getCursor(), ' ') << "*" << endl; 





















Function: printHelpText 
Usage: printHelpText () ; 
* 








Displays a message showing the legal commands. 


wip 





void printHelpText() { 
cout «« "Editor commands:" «« endl; 
cout << " Iabc Inserts the characters abc at the cursor position" << endl; 


cout «« " F Moves the cursor forward one character" «« endl; 
cout << " B Moves the cursor backward one character" «« endl; 
cout «« " D Deletes the character after the cursor" «« endl; 
cout << " J Jumps to the beginning of the buffer" << endl; 
cout << " E Jumps to the end of the buffer" «« endl; 

cout <<" H Prints this message" << endl; 

cout << " Q Exits from the editor program" << endl; 


图 13-3 (48) 


13.3 ”基于 数组 的 类 实现 


必 


正如 13.2.3 一 节 所 指出 的 ， 缓冲 区 的 一 种 可 能 表示 就 是 采用 一 个 字符 数组 。 尽 管 这 不 是 
表示 缓冲 区 的 唯一 可 选 方 案 , 但 它 仍然 是 一 个 很 有 用 的 出 发 点 。 毕 竟 ， 缓冲 区 的 字符 形成 了 
一 个 有 序 的 同 质 序列 ， 这 和 传统 的 数组 使 用 方法 是 相 一 致 的 。 然 而 ， 用 来 实现 缓冲 区 的 数组 


须 动态 分 配 ， 从 而 使 它 能 够 随 着 缓冲 区 字符 数目 的 增加 而 变 大 。 
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13.3.1 定义 私有 数据 结构 


在 很 多 方面 ， 基 于 数组 的 编辑 器 缓冲 区 的 底层 表示 看 起 来 与 第 12 章 的 charStack 类 很 
像 。charStack 类 定义 了 三 个 实例 变量 : 一 个 用 来 指向 存储 元 素 的 动态 数组 的 指针 、 数 组 
的 容量 及 其 中 字符 的 数目 。 对 于 一 个 基于 数组 的 缓冲 区 来 说 ， 需 要 相同 的 实例 变量 ， 但 将 变 
量 名 从 count KH length 是 很 有 意义 的 ， 因 为 这 样 对 于 讨论 缓冲 区 的 长 度 来 说 更 方便 一 
些 。 除 了 实例 变量 之 外 ，EditorBuffer 类 的 私有 数据 也 必须 包含 一 个 指示 当前 光标 位 置 
的 数字 。 这 些 实例 变量 外 加 私有 方法 原型 ， 以 及 一 些 标准 定义 ， 使 得 不 用 通过 拷贝 就 可 实现 
EditorBuffer 4, EditorBuffer 类 的 私有 部 分 如 图 13-4 所 示 。 


/* Private section */ 
private: 


/* 


Implementation notes: Buffer data structure 


In the array-based implementation of the buffer, the characters in the 
buffer are stored in a dynamic array. In addition to the array, the 
structure keeps track of the capacity of the buffer, the length of the 
buffer, and the cursor position. The cursor position is the index of 
the character that follows the cursor on the screen. 


/* Constants */ 
static const int INITIAL CAPACITY - 10; 
Instance variables */ 


char *array; /* Dynamic array of characters 

int capacity; /* Allocated size of that array 

int length; /* Number of character in buffer 

int cursor; /* Index of character after cursor */ 


Make it illegal to copy editor buffers */ 


EditorBuffer(const EditorBuffer & value) { } 
const EditorBuffer & operator-(const EditorBuffer & rhs) { return *this; ) 


Private method prototype */ 


void expandCapacity () ; 





图 13-4 基于 数组 实现 的 编辑 器 的 私有 部 分 
给 定 这 种 数据 结构 设计 ， 一 个 包含 以 下 内 容 的 缓冲 区 : 


HELLO 
A 


如 下 图 所 示 : 





13.3.2 缓冲 区 操作 的 实现 

基于 数组 的 编辑 器 的 大 多 数 操 作 还 是 很 容易 实现 的 。 四 个 光标 移动 操作 中 的 任何 一 -个 
都 可 以 通过 给 cursor 域 的 实例 变量 赋 一 个 新 值 来 实现 。 例 如 ， 将 光标 移动 到 缓冲 区 开 
始 ， 仅 仅 需要 给 cursor WO fü; 将 光标 移动 到 缓冲 区 未 尾 ， 仅 需要 将 length 域 拷贝 给 
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cursor 域 。 同 样 ， 将 光标 前 后 移动 也 仅仅 是 对 光标 值 的 加 减 ， 然 而 确保 光标 值 没有 越界 是 非 
常 重 要 的 。 你 可 以 在 图 13-5 中 EditorBuffer 类 的 实现 中 看 到 这 些 简单 方法 的 实现 代码 。 

图 13-5 中 唯一 需要 进一步 讨论 的 就 是 构造 孙 数 、 析 构 函 数 、insertcharacter 和 
deleteCharacter 方法 。 因 为 这 些 方法 可 能 看 起 来 比较 有 技巧 性 ， 尤 其 是 对 于 那些 初次 
接触 编码 实现 的 人 ， 所 以 在 代码 中 包含 其 操作 的 注释 是 非常 重要 的 。 例 如 ， 在 图 13-5 所 示 
的 代码 中 ， 对 那些 以 “ Implementation notes ”注释 的 特殊 的 方法 提供 了 其 他 文档 ， 诸 如 光 
标 移动 的 简单 方法 就 没有 单独 的 文档 。 

构造 函数 负责 初始 化 那些 表示 空 缓冲 区 的 实例 变量 ， 因 此 构造 函数 的 注释 是 描述 类 的 实 
例 变量 及 其 含义 的 最 佳 位 置 。 析 构 函 数 主要 用 于 释放 在 对 象 生 命 周 期 中 对 其 所 分 配 的 动态 内 
存 。 对 EditorBuffer 这 一 基于 数组 的 类 的 实现 来 说 ， 唯 一 分 配 的 动态 内 存 就 是 用 来 存储 
文本 的 数组 。 因 此 ， 析 构 函 数 的 代码 由 以 下 代码 构成 : 


delete[] array; 
它 可 以 删除 给 数组 array 分 配 的 动态 内 存 。 


/* 


* File: buffer.cpp (array version) 


* This file implements the buffer.h interface using an array representation 
rF) 
/ 


#include <iostream> 
#include "buffer.h" 
using namespace std; 
/ 
a ntation notes: Constructor and destructor 
The constructor initializes the private fields. The destructor 
frees the heap-allocated memory, which is the dynamic array 
/ 
EditorBuffer::EditorBuffer() { 
capacity = INITIAL_CAPACITY; 
array = new char[capacity]; 
length - 0; 
cursor = 0; 


} 


EditorBuffer::-EditorBuffer() { 
delete[] array; 

} 

/* 


* Implementation notes: moveCursor methods 


* The four moveCursor methods simply adjust the value of cursor. 
mf 
void EditorBuffer: :moveCursorForward() { 
if (cursor < length) cursor++; 


} 


void EditorBuffer: :moveCursorBackward() { 
if (cursor > 0) cursor--; 


) 


void EditorBuffer::moveCursorToStart() { 
cursor - 0; 


} 


void EditorBuffer: :moveCursorToEnd() { 
` cursor = length; 


) 





图 13-5 基于 数组 的 编辑 器 缓冲 区 的 实现 
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Implementation notes: character insertion and deletion 


Each of the functions that inserts or deletes characters must shift 
all subsequent characters in the array, either to make room for new 
insertions or to close up space left by deletions. 


udi 


void EditorBuffer::insertCharacter(char ch) { 
if (length == capacity) expandCapacity(); 
for (int i - length; i » cursor; i--) ( 
array[i] = array[i - 1]; 


array[cursor] = ch; 
length++; 
cursor++; 


} 


void EditorBuffer: :deleteCharacter() { 
if (cursor < length) { 
for (int i = cursor-*1; i < length; i++) 
array[i - 1] = array[i]; 
} 
length--; 


) 
/* Simple getter methods: getText, getCursor */ 


string EditorBuffer::getText() const ( 
return string(array, length); 


) 


int EditorBuffer::getCursor() const { 
return cursor; 


) 


Implementation notes: expandCapacity 


This private method doubles the size of the array whenever the old one 
runs out of space. To do so, expandCapacity allocates a new array, 
copies the old characters to the new array, and then frees the old array. 


"f 


void EditorBuffer::expandCapacity() ( 
char *oldArray - array; 
capacity *- 2; 
array = new char[capacity]; 
for (int i = 0; i « length; i++) ( 
array[i] = oldArray[i]; 


} 
delete[] oldArray; 





图 13-5 (4%) 
insertCharacter 和 deleteCharacter 方法 是 很 有 趣 的 ， 因 为 它们 都 需要 在 数组 
中 移动 字符 ， 要 么 为 待 插入 的 字符 提供 空间 ， 要 么 释放 一 个 已 删除 字符 遗留 的 空间 。 例 如 ， 
假设 你 想 在 下 面 的 缓冲 区 中 将 字符 X 插入 到 光标 位 置 : 


HELLO 
^ 


在 以 数组 表示 的 缓冲 区 中 要 进行 这 样 的 操作 ， 要 首先 确保 数组 中 有 空闲 空间 。 如 果 数 组 的 
length 域 值 与 它 的 capacity 域 值 相等 ， 则 在 当前 分 配 的 存储 空间 中 就 没有 容纳 新 字符 
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的 空间 了 。 这 样 的 话 ， 就 有 必要 像 在 第 12 章 中 charstack 类 的 实现 一 样 ， 用 同样 的 方法 
扩展 数组 的 容量 。 

然而 ， 若 数组 中 有 多 余 的 空间 ， 且 全 部 都 处 于 数组 的 最 后 。 若 在 中 间 插 和 字符， 就 需要 
在 当前 光标 所 在 的 位 置 为 将 要 插入 的 字符 提供 一 个 空间 。 获 得 空间 唯一 的 方法 就 是 将 光标 右 
侧 的 字符 都 向 右 移 动 一 个 位 置 ， 因 此 缓冲 区 结构 会 变 为 如 下 形式 : 





在 数组 中 有 一 个 空间 可 供 我 们 插入 字符 x， 此 后 光标 向 前 移动 ， 指 向 新 插入 的 字符 后 面 ， 从 
而 得 到 如 下 图 所 示 的 结构 : 





deleteCharacter 操作 也 是 类 似 的 ， 只 是 它 需 要 一 个 循环 来 去 除 删除 了 元 素 之 后 所 遗留 
下 的 数组 空间 中 的 空隙 。 


13.3.8 ”基于 数组 的 编辑 器 的 时 间 复 杂 度 


为 了 建立 一 个 可 以 与 其 他 方式 进行 比较 的 基准 ， 确 定 一 个 基于 数组 实现 的 编辑 器 的 时 间 
复杂 度 是 很 有 帮助 的 。 通 常 ， 复 杂 度 分 析 的 目的 是 理解 编辑 操作 所 需 的 执行 时 间 随 着 问题 规 
模 的 变化 是 如 何 改变 的 。 在 编辑 器 例子 中 ， 缓 冲 区 中 字符 的 数目 是 对 问题 规模 的 最 好 度量 。 
因此 ， 对 于 编辑 器 缓冲 区 ， 你 就 需要 确定 缓冲 区 的 大 小 是 如 何 影响 每 个 编辑 操作 的 运行 时 
间 的 。 

对 于 基于 数组 的 实现 ， 最 容易 理解 的 操作 就 是 移动 光标 的 操作 。 例 如 ,moveCursor- 
Forward 方法 有 如 下 实现 : 

void EditorBuffer::moveCursorForward() { 

if (cursor < length) cursor++; 

) 
尽管 这 个 方法 检查 了 缓冲 区 的 长 度 ， 但 是 过 不 了 多 久 我 们 就 知道 方法 的 执行 时 间 与 缓冲 
Ee 无 论 缓 冲 区 的 长 度 是 多 少 ， 这 个 函数 执行 的 都 是 相同 的 操作 : 进 
行 一 个 测试 ， 并 对 cursor 进行 一 个 递增 操作 。 因 为 执行 时 间 与 是 无 关 的 ， 所 以 
moveCursorForward 操作 运行 的 时 间 是 O (1 )。 相 同 的 分 析 方 法 适用 于 其 他 移动 光标 的 
操作 ， 这 些 操作 都 与 缓冲 区 的 长 度 无 关 。 

但 是 insertcharacter 方 法 怎样 呢 ? 在 基于 数组 实现 的 EditorBuffer 类 中 ， 
insertCharacter 方法 的 内 容 包 含 下 面 的 for 循环 : 

for (int i - length; i > cursor; i--) ( 


array[i] = array[i - 1]; 
) 
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如 果 在 缓冲 区 的 末尾 插入 一 个 字符 ， 那 么 这 个 方法 运行 得 特别 快 ， 因 为 这 样 就 不 需要 移动 别 
的 字符 以 便 为 新 的 字符 留 出 空间 。 换 一 个 角度 来 看 ， 如 果 在 缓冲 区 的 开头 插入 一 个 字符 ， 缓 
冲 区 数组 的 每 一 个 元 素 都 需要 右 移 。 于 是 ， 在 最 坏 情 况 下 ，insertcharacter 方法 的 运 
行 时 间 与 字符 的 个 数 成 正比 ， 因 此 时 间 复 杂 度 是 O (N)。 由 于 deleteCharacter 方法 与 
insertCharacter 方法 的 情况 类 似 ， 因 此 ， 它 的 表 13-2 基于 数组 的 缓冲 区 时 间 复 杂 度 
时 间 复 杂 度 也 是 0 ( N)。 每 个 编辑 器 操作 的 时 间 复 
杂 度 见 表 13-2。 

对 于 编辑 器 程序 来 说 ， 表 中 最 后 两 个 需要 线性 
时 间 的 操作 具有 很 重要 的 性 能 。 如 果 一 个 编辑 器 使 _RoveCursorBackware 
用 数组 来 表示 其 内 部 的 缓冲 区 ， 它 就 会 随 着 缓冲 区 _movecursorfoStart 
中 字符 数目 的 增加 而 运行 得 越 来 越 慢 。 由 于 这 个 间 _movecursorToEnd 
题 看 起 来 比较 严重 ， 所 以 探索 其 他 的 表示 是 合乎 情 _insertcharacter 


理 的 。 deleteCharacter 


13.4 基于 栈 的 类 实现 


用 数组 实现 缓冲 区 的 问题 在 于 : 当 插入 和 删除 操作 发 生 在 数组 的 开头 部 分 时 ， 程 序 会 运 
行 得 很 慢 。 当 上 述 相同 的 操作 在 数组 的 尾部 进行 时 ， 程 序 的 运行 速度 就 相对 较 快 ， 因 为 这 不 
需要 移动 数组 内 部 的 字符 。 这 种 性 质 暗 示 了 一 种 加 快运 行 的 方法 : 迫使 所 有 的 插入 和 删除 字 
符 操作 都 发 生 在 缓冲 区 的 尾部 。 尽 管 这 种 方法 从 用 户 的 角度 来 看 是 完全 不 可 行 的 ， 但 是 它 确 
实 是 一 种 可 行 方法 的 萌芽 。 

使 插入 和 删除 操作 变 快 的 必要 技术 就 是 : 可 以 以 光标 位 置 为 分 界线 ， 将 缓冲 区 分 为 光标 
前 和 光标 后 两 个 相互 独立 的 结构 。 因 为 所 有 对 缓冲 区 的 修改 都 出 现在 光标 的 位 置 ， 所 以 这 些 
结构 都 像 栈 一 样 ， 并 且 可 以 用 第 12 章 介绍 的 charStack 类 来 表示 。 在 光标 之 前 的 元 素 被 
压 人 一 个 栈 中 ， 因 此 缓冲 区 的 首 元 素 就 在 栈 底 ， 而 光标 之 前 的 那个 元 素 则 在 栈 顶 。 在 光标 之 
后 的 元 素 的 存储 与 此 恰恰 相反 ， 将 缓冲 区 的 最 后 一 个 元 素 放 在 栈 底 ， 然 后 将 光标 后 面 的 那个 
元 素 放 在 栈 顶 。 

说 明 这 种 结构 的 最 好 方法 就 是 使 用 一 个 图 。 如 果 这 个 缓冲 区 包含 以 下 内 容 : 


HE LL o 
则 该 缓冲 区 的 两 个 栈 的 表示 如 下 图 所 示 : 
工 
E ( L 
H o 
before after 


为 了 读 取 缓冲 区 的 内 容 ， 有 必要 如 图 中 箭头 所 示 的 那样 先 读 取 before 栈 的 内 容 ， 然 后 再 
读 取 after 栈 的 内 容 。 


13.4.1 定义 私有 数据 结构 


使 用 这 种 策略 ， 即 一 个 缓冲 区 对 象 的 实例 变量 就 是 一 对 栈 ， 它 们 分 别 保存 光标 前 后 两 部 
分 缓冲 区 的 内 容 。 对 基于 栈 的 缓冲 区 而 言 ， 类 的 私有 部 分 的 声明 仅 有 如 图 13-6 所 示 的 两 个 
实例 变量 。 切 记 ， 光 标 在 这 个 模型 中 不 是 明确 表示 的 ， 它 仅仅 是 两 个 栈 的 边界 。 


数 组 
moveCursorForward O (1) 
O (1) 
O (1) 
O0 (1) 
O(N) 
O(N) 
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/* Private section */ 


private: 


Implementation notes: Buffer data structure 


In the stack-based buffer model, the characters are stored in two 
stacks. Characters before the cursor are stored in a stack named 
"before"; characters after the cursor are stored in a stack named 
"After". In each case, the characters closest to the cursor are 
closer to the top of the stack. The advantage of this 
representation is that insertion and deletion at the current 
cursor position occurs in constant time. 


/ 


* 
* 
* 
* 
* 
* 
* 
* 


/* Instance variables */ 


CharStack before; /* Stack of characters before the cursor */ 
CharStack after; /* Stack of characters after the cursor */ 


/* Make it illegal to copy editor buffers */ 


EditorBuffer(const EditorBuffer & value) { } 
const EditorBuffer & operator-(const EditorBuffer & rhs) { return *this; } 





图 13-6 基于 栈 的 编辑 器 的 私有 部 分 


13.4.2 ”缓冲 区 操作 的 实现 


在 栈 模型 中 , 编辑 器 的 大 部 分 操作 的 实现 还 是 很 简单 的 。 例 如 ， 后 移 元 素 只 需要 将 
before 栈 的 元 素 弹出 后 压 人 after 栈 即 可 。 前 移 元 素 也 是 与 此 相对 称 的 。 插 入 字符 需要 
将 该 字符 压 入 before 栈 。 删 除 元 素 就 包括 从 after 栈 将 字符 弹出 栈 并 扔 掉 字符 。 

这 种 概念 上 的 操作 框架 使 得 编写 基于 栈 的 编辑 器 代码 更 容易 ， 其 实现 代码 如 图 13-7 所 示 。 
insertCharacter、 deleteCharacter、 moveCursorForward 和 moveCursorBackward 


这 四 个 命令 的 执行 时 间 是 常数 时 间 ， 因 为 它们 调用 的 栈 操作 的 时 间 复 杂 度 为 O (1)。 


/* 


* File: buffer.cpp (stack version) 


* This file implements the EditorBuffer class using a pair of character 
* stacks to represent the buffer. 

xf 
finclude <iostream> 
finclude "buffer.h" 


#include "charstack.h" 
using namespace std; 


/* 


* Implementation notes: Constructor and destructor 


* In this implementation, all dynamic allocation is managed by the 
* CharStack class, which means there is no work for EditorBuffer to do. 


*y 


EditorBuffer::EditorBuffer() { ) 
EditorBuffer::-EditorBuffer() ( ) 


/* 


* Implementation notes: moveCursor methods 


* The four moveCursor methods use push and pop to transfer values 
between the two stacks. 





图 13-7 基于 栈 的 编辑 器 的 实现 
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void EditorBuffer: :moveCursorForward() { 
if (lafter.isEmpty()) ( 
before.push(after.pop()); 
) 
) 


void EditorBuffer::moveCursorBackward() ( 
if (!before.isEmpty()) { 
after.push (before.pop()); 
} 
} 


void EditorBuffer: :moveCursorToStart() { 
while (!before.isEmpty()) { 
after.push (before.pop()) ; 
} 
} 


void EditorBuffer::moveCursorToEnd() { 
while (!after.isEmpty()) ( 
before.push(after.pop()); 
) 


Implementation notes: character insertion and deletion 


Each of th fi ions that inserts or deletes characters can do 
witi a single push or pop operation 
7 


void EditorBuffer::insertCharacter(char ch) { 
before.push(ch); 
) 


void EditorBuffer::deleteCharacter() ( 
if (lafter.isEmpty()) ( 
after.pop(); 


Implementation notes: getText and getCursor 


The only difficult part of implementing these operators is making 
sure that the ate of the buffer is restored after copying the 
characters from the two stacks. 


string EditorBuffer::getText() const ( 

CharStack beforeCopy - before;. 

CharStack afterCopy - after; 

string str - ""; 

while (!beforeCopy.isEmpty()) { 
str = beforeCopy.pop() + str; 

) 

while (!afterCopy.isEmpty()) { 
str += afterCopy.pop(); 

) 

return str; 


} 


int EditorBuffer::getCursor() const { 
return before.size(); 


) 





图 13-7 (48) 


但 是 剩余 的 两 个 操作 moveCursorToStart fll moveCursorToEnd 又 会 怎样 呢 ? 
上 述 每 一 种 操作 都 需要 将 某 个 栈 内 的 全 部 内 容 移动 到 另外 一 个 栈 里 。 假 设 这 个 操作 由 类 
CharStack 提供 ， 完 成 此 操作 唯一 的 方法 就 是 将 这 些 字符 一 个 个 从 一 个 栈 弹 出 并 压 入 到 男 
外 一 个 栈 中 ， 直 到 最 开始 的 栈 为 空 栈 。 例 如 ，moveCcursorToEnad 操作 就 有 如 下 实现 : 
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void EditorBuffer::moveCursorToEnd() ( 
while ('after.isEmpty()) { 
before.push(after.pop()); 
} 
} 


这 些 实现 可 以 达到 预期 的 结果 ， 不 过 在 最 坏 情况 下 ， 它 的 时 间 复 杂 度 为 O(N)。 


13.4.3 ”时 间 复 杂 度 的 比较 


A 13-3 列 出 了 基于 数组 和 基于 栈 的 编辑 器 实现 的 操作 的 时 间 复 杂 度 。 哪 种 实现 更 好 
WE? 如 果 没 有 一 些 使 用 模式 的 知识 ， 就 很 难 回答 这 个 问题 。 然 而 ， 如 果 对 人 们 使 用 编辑 天 的 
方式 有 所 了 解 的 话 ， 就 会 觉得 基于 栈 的 表示 更 高 效 。 因 为 基于 数组 实现 的 较 慢 的 操作 (插入 
和 删除 ) 使 用 的 频率 要 远 远 高 于 基于 栈 实现 的 比较 耗 时 的 操作 (将 光标 移动 很 长 一 段 距离 )。 

如 果 涉 及 操作 的 使 用 频率 的 话 ， 这 种 权衡 是 相对 合理 的 。 但 是 也 有 必要 再 问 一 下 有 没 
有 更 好 的 方案 。 毕 竟 ， 我 们 可 以 确定 这 六 个 基本 编辑 操作 中 至 少 有 一 个 在 上 述 两 个 编辑 融 的 
实现 中 的 运行 时 间 是 常数 时 间 。 搬 入 运算 在 数组 实现 中 比较 慢 ， 但 是 在 使 用 栈 实现 时 是 很 快 
的 。 相 反 ， 将 光标 移 到 缓冲 区 开头 对 数组 来 说 特别 快 ， 但 对 于 栈 那 就 比较 慢 了 。 然 而 ， 没 有 
任何 一 种 操作 ， 从 本 质 上 来 说 是 慢 的 。 因 为 总 有 某 种 实现 可 以 让 该 操作 变 快 。 那 有 可 能 开发 
出 一 种 使 得 所 有 的 操作 都 比较 快 的 实现 吗 ? 答案 是 肯定 的 ， 但 是 解决 谜 题 的 关键 就 需要 你 学 
习 一 种 新 的 方法 ， 以 便 在 一 个 数据 结构 中 表示 元 素 的 有 序 关系 。 


表 13-3 ”基于 数组 和 基于 栈 的 缓冲 区 的 时 间 复 杂 度 


moveCursorForward O(1) 
moveCursorBackward O(1) 
moveCursorToStart O(N) 
moveCursorToEnd O(N) 
insertCharacter O(1) 
deleteCharacter O(1) 


13.5 ”基于 列表 的 类 实现 


作为 寻找 一 个 更 加 高 效 的 编辑 器 缓冲 区 表示 的 第 一 步 ， 检 查 之 前 的 方法 为 何不 能 对 特定 
操作 提供 有 效 服 务 是 很 有 意义 的 。 在 数组 实现 的 例子 中 , 答案 是 显而易见 的 : 当 我 们 需要 在 
缓冲 区 的 开头 搬入 一 些 文本 时 ， 需 要 移动 大 量 的 字符 。 例 如 ， 假 设 你 准备 输入 字母 表 却 输 成 
了 如 下 情况 : 

ACDEFGHIJKLMNOPQRSTUVWXYZ 

当 你 发 现 遗 漏 了 字母 B 时 ， 就 需要 将 接 下 来 的 24 个 字符 统一 右 移 一 位 ， 从 而 为 遗漏 的 字母 
腾 出 位 置 。 只 要 缓冲 区 不 是 特别 大 ， 一 台 现 代 计 算 机 可 以 相对 快捷 地 完成 此 操作 。 虽 然 如 
此 ， 如 果 缓 冲 区 里 面 字符 的 数目 已 足够 大 的 话 ， 这 种 操作 所 需 的 时 间 还 是 相当 可 观 的 。 

然而 ,假设 你 写 信 的 时 候 现代 计算 机 还 没有 发 明 。 想 象 你 是 托马斯 * 杰斐逊 ， 正 在 忙于 
起 草 独立 宣言 。 在 对 乔治 沙皇 的 抱怨 中 ， 你 很 认真 地 写 下 了 下 面 这 句 话 : 
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遗憾 的 是 ， 在 最 后 一 分 钟 ， 有 人 觉得 在 这 个 句子 中 的 第 二 个 injury 前 面 加 上 only 一 词 更 为 
恰当 。 对 这 个 问题 思考 一 会 之 后 ， 你 可 能 决定 (就 像 有 人 在 真实 的 独立 宣言 中 做 的 那样 ) 拿 
出 你 的 笔 ， 像 下 面 这 样 加 上 漏 掉 的 单词 : 


如 果 用 同样 的 策略 给 字母 表 添加 遗漏 的 字母 ， 你 可 能 会 做 如 下 的 编辑 : 


B 
ACDEFGHIJKLMNOPQRSTUVWXYZ 
^ 


这 个 结果 可 能 看 起 来 不 太 优 雅 ， 但 在 这 种 特殊 情况 下 也 是 可 以 接受 的 。 

使 用 这 种 过 时 的 编辑 策略 的 优点 在 于 : 它 允 许 你 打破 所 有 字母 都 必须 按照 它们 像 输出 时 
以 特定 顺序 排序 这 一 规则 。 下 一 行 的 插入 符 告 诉 你 的 眼睛 在 读 完 A 以后， 需要 上 移 读 B， 接 
着 下 移 读 Cc， 然后 再 按照 顺序 继续 读 。 也 需要 注意 到 使 用 这 种 插入 策略 的 另 一 个 优点 。 不 管 
这 一 行 有 和 多 长 ， 你 要 做 的 仅仅 是 写 一 个 新 的 字符 和 插入 符号 。 当 使 用 纸 笔 时 ,插入 所 用 的 时 
间 是 常数 时 间 。 

链表 可 以 允许 你 达到 近乎 相同 的 效果 。 如 果 字符 是 存储 在 一 个 链表 中 而 不 是 字符 数组 
中 ,插入 一 个 遗漏 的 字符 你 所 要 做 的 仅仅 是 修改 几 个 指针 。 如 果 缓 冲 区 的 原始 内 容 用 以 下 链 
表 存 储 : 


A>C>D+E>F>G+H>I>J>K>L>M>N>0+P+Q>R>S>T>U>V>W>X+Y>Z 


你 所 需要 做 的 就 是 : C1) 把 B 写 在 某 处 ; (2) 从 B 开 始 画 一 个 箭头 让 它 指 向 A 原来 所 指向 
的 地 方 〈 也 就 是 现在 的 c); (3) BUE A 箭头 所 指 的 位 置 让 它 指向 B， 如 下 图 所 示 : 


B 
RO» DA E-F-G-H2 I-)J-oK-^L-M-2N2O-»P-Q»RSoT-U-2V-—W»X-Y-2 


这 个 结构 和 第 12 章 的 链表 具有 相同 的 形式 。 为 了 表示 这 个 字符 链 ， 你 需要 将 这 些 字 符 
存 人 链表 的 结 点 中 。 例 如 ， 字 符 串 ABC 的 链表 如 下 图 所 示 : 


LA. CLOS IT 
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然而 在 链表 结构 图 中 ， 通 常 可 以 在 结 点 中 画 一 条 斜 线 以 表示 它 是 空 值 (NULL)， 如 上 面 例子 
中 的 C 结 点 所 示 。 

乍 一 看 ， 链 表 是 你 要 表达 缓冲 区 内 容 的 全 部 。 唯 一 的 问题 就 是 你 还 需要 表示 光标 位 
置 。 如 果 用 整数 的 形式 存储 光标 ， 寻 找 光 标的 当前 位 置 就 需要 数 这 个 链表 结 点 的 个 数 直 
到 光标 所 在 的 位 置 为 止 。 这 个 策略 需要 的 时 间 是 线性 的 。 一 个 更 好 的 方法 就 是 定义 一 个 
EditorBuffer 类， 并 且 它 包含 两 个 指向 结 点 类 Cell 对 象 的 指针 : 一 个 start 指针 说 明 
链表 从 何 处 开始 ; 一 个 cursor 指针 标记 当前 光标 的 位 置 。 

在 没有 了 解 光 标的 工作 细节 前 ， 你 可 能 会 觉得 这 个 设计 似乎 比较 合理 。 如 果 一 个 缓冲 区 
有 三 个 字符 ， 你 的 第 一 反应 肯定 是 使 用 一 个 有 三 个 结 点 的 链表 。 遗 憾 的 是 ， 这 里 还 有 一 些 问 
题 。 假 设 一 个 缓冲 区 有 三 个 字符 ， 而 对 于 光标 而 言 却 有 四 个 可 能 的 位 置 ， 如 下 图 所 示 : 


ABC ABC ABC ABC 
^ ^ ^ ^ 
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如 果 cursor 域 在 这 里 只 有 三 个 结 点 可 以 存放 其 指向 ， 你 就 不 清楚 怎样 才能 表示 每 个 可 能 
的 光标 位 置 。 

解决 这 个 问题 有 很 多 巧妙 的 方法 。 但 最 常用 的 就 是 额外 分 配 一 个 结 点 ， 以 便 让 该 链表 对 
每 个 可 能 的 插入 点 都 有 一 个 存储 单元 。 通 常 而 言 ， 这 个 额外 分 配 的 结 点 处 于 链表 首部 ， 被 称 
为 空 结 点 (dummy cell) 。 空 结 点 中 cn 域 的 值 是 无 关 的 ， 在 图 上 用 灰色 的 背景 表示 。 

当 使 用 空 结 点 方法 时 ，cursor 域 指向 逻辑 插入 点 的 前 面 。 例 如 ， 一 个 包含 ABC 且 光 
标 在 最 前 面 的 缓冲 区 看 起 来 如 下 图 所 示 : 





start 指针 和 cursor 指针 均 指向 空 结 点 ， 并 在 空 结 点 后 面 进行 插入 操作 。 如 果 cursor 
域 指 向 了 缓冲 区 的 末尾 ,其 链表 图 就 该 具有 如 下 形态 : 





出 现在 类 的 私有 部 分 的 仅 有 的 实例 变量 就 是 start 指针 和 cursor 指针 。 尽 管 这 个 结 
构 的 剩余 部 分 还 没有 正式 成 为 该 对 象 的 一 部 分 。 但 如 果 在 buffer.h 文件 的 私有 部 分 中 将 
这 种 结构 文档 化 ， 它 可 以 为 之 后 使 用 这 种 结构 的 程序 员 提 供 帮 助 ， 如 图 13-8 所 示 。 


/* Private section */ 
private: 


/* 


* Implementation notes: Buffer data structure 


* 


In the linked-list implementation of the buffer, the characters 
in the buffer are stored in a list of Cell structures, each of 
which contains a character and a pointer to the next cell in the 
chain. To simplify the code used to maintain the cursor, this 
implementation adds an extra "dummy" cell at the beginning of the 
list. The character in this cell is not used, but having it in 
the data structure provides a cell for the cursor to point to 
when the cursor is at the beginning of the buffer. 


The following diagram shows the structure of the list-based buffer 
containing "ABC" with the cursor at the beginning: 


+++ +++ +++ +++ 


This structure type is used locally within the implementation to 
store each cell in the linked-list representation. Each cell 
contains one character and a pointer to the next cell in the chain. 








图 13-8 ”基于 链表 的 编辑 器 的 私有 部 分 
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struct Cell ( 
char ch; 

Cell *link; 
hi 


Instance variables */ 


Cell *start; /* Pointer to the dummy celi wf 
Cell *cursor; /* Pointer to cell before cursor  */ 


* Make it illegal to copy editor buffers */ 


EditorBuffer(const EditorBuffer & value) ( ) 
const EditorBuffer & operator-(const EditorBuffer & rhs) ( return *this; ) 
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13.5.1 链表 缓冲 区 的 插入 操作 


无 论 光标 的 位 置 在 哪里 ,链表 的 插入 操作 由 下 面 几 步 构成 : 

1. 分 配 一 个 新 的 结 点 ， 让 临时 变量 cp 指向 这 个 新 的 结 点 。 

2. 将 要 插入 的 字符 的 值 复制 到 新 的 结 点 。 

3. 找到 cursor 域 所 指向 的 结 点 ， 让 新 分 配 的 结 点 的 指针 指向 该 指针 的 指针 。 这 个 操作 
可 以 保证 你 没有 丢失 当前 光标 所 指向 的 结 点 中 的 字符 。 

4. 改变 当前 光标 所 指向 的 结 点 的 指针 ， 让 它 指向 新 的 结 点 。 

5. 改变 缓冲 区 中 的 cursor 域 的 指针 ， 让 它 指 向 新 的 结 点 。 这 个 操作 可 以 保证 插入 一 个 
字符 后 ， 下 一 个 字符 也 可 以 通过 同样 的 方法 插入 。 

为 了 解释 这 个 过 程 ， 假 设 你 想 把 字母 B 插入 到 如 下 的 缓冲 区 中 : 


ACD 
^ 


如 上 图 所 示 ， 光 标 在 字母 A 和 Cc 之 间 。 在 插入 之 前 链表 状况 如 下 图 所 示 : 





第 二 步 : 将 字符 B 存 人 新 的 结 点 中 的 ch 域 ， 如 下 图 所 示 : 
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Ld 
第 三 步 : 将 光标 cursor 所 指 位 置 的 结 点 的 指针 赋 给 新 的 结 点 的 指针 。 指 针 指向 的 结 点 
就 包含 字符 c， 结 果 如 下 图 所 示 : 





所 示 : 





注意 到 缓冲 区 现在 已 经 有 了 正确 的 内 容 。 如 果 从 缓冲 区 起 始 的 空 结 点 开始 ， 依 照 箭头 指示 ， 
我 们 会 依次 发 现 包 含 A、B、C 和 D 这 四 个 字母 的 结 点 。 

最 后 一 步 就 是 修改 缓冲 区 结构 中 的 光标 cursor 指针 域 ， 使 其 指向 新 分 配 的 结 点 ， 完 
成 之 后 其 链表 内 容 如 下 图 所 示 : 





当 这 个 程序 从 insertcharacter 方法 返回 后 ， 临 时 变量 cp 就 会 被 释放 。 最 终 缓 冲 区 的 
状态 如 下 图 所 示 : 
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这 个 缓冲 区 的 内 容 包括 : 


ABCD 
^ 


下 面 是 用 C++ 语言 对 insertCharacter 方法 实现 的 一 个 简单 版 本 ， 它 可 以 分 为 几 个 步骤 
实现 : 
void EditorBuffer::insertCharacter(char ch) ( 
Cell *cp - new Cell; 
cp-»ch = ch; 
cp-»link = cursor->link; 
cursor->link = cp; 
cursor = cp; 


} 
由 于 在 这 个 方法 里 没有 循环 ， 所 以 insertcharacter 方法 的 运行 时 间 是 常数 时 间 。 


13.5.2 ”链表 缓冲 区 的 删除 操作 


在 链表 中 删除 一 个 结 点 ， 你 要 做 的 只 是 将 它 从 指针 链 中 移 除 。 假 设 当前 缓冲 区 的 内 
容 为 : 


ABC 
^ 


采用 图 形 表示 法 ， 它 的 状态 如 下 所 示 : 





删除 光标 之 后 的 字符 需要 你 通过 改变 存储 字母 A 的 那个 结 点 的 指针 ， 使 其 指向 存储 字母 B 
的 结 点 ， 从 而 删除 存储 字母 B 的 结 点 。 为 了 找到 想 要 删除 的 字符 ， 你 需要 使 当前 指针 指向 它 
所 指向 结 点 的 指针 所 指向 的 结 点 。 因 此 必要 的 语句 为 : 


cursor->link = cursor->link->link; 


执行 这 条 语句 就 会 让 缓冲 区 变 为 以 下 状态 : 
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由 于 存储 字母 B 的 结 点 对 于 链表 而 言 是 不 可 访问 的 ， 因 此 ， 通 过 调用 delete 函数 将 
它 释 放 是 一 个 好 办 法 。 正 如 以 下 aeletecharactez 方 法 的 实现 : 


void EditorBuffer::deleteCharacter() { 
if (cursor->link != NULL) { 
Cell *oldCell = cursor->link; 
cursor->link = cursor->link->link; 
delete oldCell; 
} 
} 


注意 : 当 你 调整 链表 指针 时 ， 你 需要 一 个 像 oldce11 的 变量 来 保存 将 要 被 释放 的 指针 所 指 
向 的 结 点 。 如 果 你 没有 保存 这 个 值 ， 当 你 调用 delete 函数 时 ， 将 无 法 获得 该 结 点 。 


13.5.3 ”链表 表示 法 中 光标 的 移动 

f£ EditorBuffer 类 中 剩 下 的 操作 就 是 对 光标 的 简单 移动 。 你 该 如 何在 链表 的 缓冲 区 
中 实现 这 些 操 作 呢 ? 其 中 的 movecursorEorward Ñ moveCursorToStart 这 两 种 操作 
在 链表 模型 中 是 很 容易 实现 的 。 例 如 ， 要 将 光标 前 移 ， 你 只 需要 将 缓冲 区 中 指向 当前 结 点 的 
Link 域 指针 值 取出 来 ， 并 使 cursor 指针 指向 该 结 点 的 link 域 指针 所 指向 的 结 点 。 实 现 
该 操作 的 必要 语句 如 下 : 

cursor = cursor->link; 


例如 ， 假 设 编 辑 器 缓冲 区 包含 如 下 图 所 示 在 开始 位 置 的 光标 : 


ABC 
^ 


那么 缓冲 区 的 链表 结构 图 为 : 





当然 ， 当 到 达 缓 冲 区 的 末尾 时 ， 你 就 不 能 再 前 移 光标 了 。movecursorForward 操作 
的 实现 必须 检查 这 种 情况 ， 所 以 该 方法 的 完整 定义 如 下 : 
void EditorBuffer::moveCursorForward() { 
if (cursor->link !- NULL) { 
cursor = cursor->link; 


} 
} 


将 光标 移动 到 缓冲 区 的 起 始 处 是 非常 简单 的 。 无 论 光 标 处 在 哪个 位 置 ， 我 们 都 可 
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以 通过 把 start 指针 复制 给 cursor 指针 ， 从 而 将 光标 移动 到 缓冲 区 的 开头 。 因 此 ， 
moveCursorToStart 的 实现 仅仅 是 以 下 代码 : 


void EditorBuffer::moveCursorToStart() ( 
cursor = start; 


) 


Skil, moveCursorBackward lmoveCursorToEnd 操作 更 加 复杂 。 例 如 ， 假 设 光 
标 在 包含 了 字符 ABC 的 缓冲 区 的 末尾 ， 你 想 将 光标 后 移 一 个 位 置 。 若 以 图 形 表 示 ， 这 个 组 
冲 区 如 下 图 所 示 : 





假设 在 EditorBuffer 类 中 ， 回 溯 指 针 操 作 不 为 常数 时 间 。 问 题 是 你 没有 简单 的 方法 (从 
你 看 到 的 信息 中 ) 找 出 当前 结 点 的 前 一 个 结 点 。 指 针 可 以 允许 你 按照 其 指向 对 象 的 一 条 链 继 
续 向 前 查找 ， 但 是 指针 的 指向 是 不 能 逆转 的 。 仅 给 定 一 个 结 点 的 地 址 是 无 法 找 出 其 结 点 之 前 
的 结 点 的 。 关 于 指针 图 ， 这 种 约束 的 效果 就 是 我 们 可 以 从 箭头 的 尾部 移动 到 它 所 指向 的 结 点 
中 ， 但 我 们 不 可 以 从 箭头 的 顶部 返回 指向 该 箭头 的 结 点 。 

在 由 链表 结构 表示 的 缓冲 区 中 ， 你 需要 以 你 在 缓冲 区 结构 中 看 到 的 数据 来 实现 每 一 个 
操作 ， 这 些 数据 包含 start HEA cursor 指针 。 仅 仅 关 注 cursor 指针 并 且 按 照 光标 
当前 位 置 可 以 到 达 的 位 置 是 没 希 望 的 。 因 为 在 那 条 指针 链 上 可 到 达 的 结 点 都 是 那些 缓冲 区 
中 特别 靠 后 的 单元 。 然 而 ，start 指针 就 为 你 提供 了 完整 的 指针 链表 。 同 时 ， 你 也 需要 关注 
cursor 指针 的 值 ， 因 为 你 需要 回 到 那个 位 置 。 

在 放弃 希望 之 前 ， 你 要 意识 到 : 找 出 当前 结 点 之 前 的 那个 结 点 是 可 能 的 。 不 过 在 常量 时 
间 内 完成 是 不 可 行 的 。 当 你 从 缓冲 区 的 开头 开始 按照 链表 顺序 遍历 它 的 每 个 结 点 时 ， 最 终 会 
发 现 一 个 结 点 ， 这 个 结 点 的 link 指针 刚好 和 EditorBuffer 自身 的 cursor 指针 指向 的 
是 同一 个 结 点 。 这 个 结 点 就 是 光标 所 指向 的 结 点 前 面 的 那个 结 点 。 只 要 找到 这 个 结 点 ， 你 就 
可 以 将 EditorBuffer 的 cursor 指针 指向 该 结 点 ， 这 样 做 和 将 光标 后 移 的 效果 是 相同 的 。 

你 可 以 通过 第 12 章 介绍 的 传统 的 for 循环 来 编写 寻找 光标 的 程序 。 然 而 ， 这 种 方法 有 
两 个 问题 。 首 先 ， 当 循环 结束 后 ， 你 需要 使 用 指针 变量 的 值 ， 这 也 就 意味 着 你 要 在 循环 外 对 
这 个 变量 进行 声明 。 其 次 ， 如 果 你 用 标准 的 for 循环 ， 你 会 发 现 这 个 变量 与 循环 体 完全 没 
有 任何 联系 。 因 为 你 所 关注 的 仅仅 是 指针 变量 的 值 。 包 含 空 循环 体 的 循环 语句 会 给 读者 一 种 
缺少 某 种 东西 的 感觉 ， 从 而 使 代码 难以 阅读 。 

鉴于 这 些 原因 ， 用 while 语句 编写 循环 代码 就 会 比较 简单 ， 如 下 所 示 : 

Cell *cp = start; 
while (cp->link != cursor) { 
cp = cp->link; 
} 
4whlie 循环 结束 后 ，cp 就 指向 光标 前 面 的 那个 结 点 。 随 着 光标 向 前 移动 ， 你 需要 防止 这 
个 循环 试图 超出 缓冲 区 的 范围 ， 所 以 moveCursorBackward 的 完整 代码 如 下 所 示 : 
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void EditorBuffer: :moveCursorBackward() { 


if (cursor !- start) { 
Cell *cp = start; 
while (cp->link != cursor) { 


cp = cp->link; 
} 
cursor = cp; 
} 
} 


基于 同样 的 原因 ， 你 可 以 仅仅 通过 将 光标 前 移 直 至 它 指向 链表 的 最 后 一 个 结 点 ， 即 发 现 
空 值 NULL 为 止 ， 因 此 ， 完 整 的 movecursorToEnd 方法 的 实现 如 下 所 示 : 
void EditorBuffer::moveCursorToEnd() ( 
while (cursor->link !- NULL) { 
cursor = cursor->link; 


} 
} 


13.54 缓冲 区 实现 的 完善 


完整 的 EqditBuffer 类 包含 了 一 些 到 现在 还 没有 实现 的 方法 : 构造 函数 、 析 构 函 数 ， 
以 及 getText 和 getCursor 方法 。 在 构造 函数 中 ， 你 唯一 需要 注意 的 就 是 要 记 住 空 结 点 
的 存在 。 在 编码 的 时 候 ， 即 使 对 于 空 的 缓冲 区 ， 也 必须 分 配 空 结 点 所 需 的 存储 空间 。 然 而 ， 
一 旦 你 记 住 这 个 细节 之 后 ,编码 就 相对 容易 了 : 
EditorBuffer::EditorBuffer() { 
start = cursor = new Cell; 
start->link = NULL; 
} 
析 构 函数 的 实现 更 为 微妙 。 当 析 构 函数 被 调用 之 后 ， 它 就 有 职责 释放 该 类 所 分 配 的 所 有 
内 存 。 这 些 内 存 也 包括 在 链表 中 分 配 的 各 个 结 点 。 和 之 前 讨论 的 for 循环 一 样 ， 你 可 能 会 
编写 以 下 的 循环 代码 : 


for (Cell *cp = start; cp != NULL; cp = cp->link) { 
delete cp; 


) 


这 里 的 问题 是 当 结 点 空间 被 释放 以 后 ， 这 段 代码 会 尝试 使 用 所 释放 的 结 点 的 1ink 指针 。 一 
旦 执行 delete 操作 ， 就 不 允许 再 次 访问 所 删除 的 cp 所 指 结 点 中 link 指针 所 指向 的 内 容 
了 。 这 样 做 很 可 能 会 导致 错误 。 为 了 解决 这 个 问题 ， 你 就 需要 在 释放 每 个 结 点 后 ， 用 一 个 独 
立 的 变量 记录 你 当前 的 位 置 。 本 质 上 ， 你 需要 维持 一 个 位 置 。 因 此 ，~EditorBuffer 的 
正确 编码 会 更 为 复杂 ， 并 且 具 有 如 下 形式 : 


EditorBuffer::-EditorBuffer() { 
Cell *cp = start; 
while (cp != NULL) ( 
Cell *next = cp->link; 
delete cp; 
cp - next; 
) 
) 
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602 基于 链表 的 缓冲 区 类 的 实现 的 完整 代码 如 图 13-9 所 示 。 


This file implements the EditorBuffer class using a linked 
list to represent the buffer. 


#include <iostream> 
#include "buffer.h" 
using namespace std; 


/* 


* Implementation notes: EditorBuffer constructor 


* The constructor initializes an empty editor buffer represented as 
* a linked list. In this representation, the empty buffer contains 
* a "dummy" cell whose ch field is never used. The constructor 
* allocates this dummy cell and then sets the internal pointers. 


wf 


EditorBuffer: :EditorBuffer() { 
start = cursor = new Cell; 
start-»link = NULL; 


Implementation notes: EditorBuffer destructor 


The destructor deletes every cell in the buffer. Note that the loop 
structure is not exactly the standard for loop pattern for processing 
every cell within a linked list. The complication that forces this 
change is that the body of the loop can't free the current cell and 
later have the for loop use the link field of that cell to move to 
the next one. To avoid this problem, this implementation copies the 
link pointer before calling delete. 


EditorBuffer::-EditorBuffer() ( 
Cell *cp - start; 
while (cp !- NULL) ( 
Cell *next = cp->link; 
delete cp; 
cp = next; 


Implementation notes: moveCursor methods 


The four methods that move the cursor have different time complexities 
because the structure of a linked list is asymmetrical with respect to 
moving backward and forward. The moveCursorForward and moveCursorToStart 
methods operate in constant time. By contrast, the moveCursorBackward 
and moveCursorToEnd methods each require a loop that runs in linear time. 


void EditorBuffer::moveCursorForward() ( 
if (cursor-»link !- NULL) ( 
cursor = cursor->link; 
} 
) 


void EditorBuffer::moveCursorBackward() ( 
if (cursor !- start) ( 
Cell *cp - start; 
while (cp-»link != cursor) ( 
cp = cp->link; 
} 


cursor = cp; 





图 13-9 基于 链表 的 编辑 器 缓冲 区 的 实现 
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void EditorBuffer: :moveCursorToStart () 
cursor = start; 


) 


void EditorBuffer::moveCursorToEnd() ( 
while (cursor-»link != NULL) { 
cursor = cursor-»link; 


) 


Implementation notes: insertCharacter 
The steps required to insert a new character are: 


. Allocate a new cell and put the new character in it. 

Copy the pointer indicating the rest of the list into the link. 
. Update the link in the current cell to point to the new one. 
. Move the cursor forward over the inserted character. 


void EditorBuffer::insertCharacter(char ch) { 
Cell *cp - new Cell; 
cp-»ch = ch; 
cp-»link = cursor-»link; 
cursor-»link = cp; 
cursor = cp; 


Implementation notes: deleteCharacter 


The steps necessary to delete the character after the cursor are: 


1. Remove the current cell by pointing to its successor. 
2. Free the cell to reclaim the memory. 


/ 


void EditorBuffer::deleteCharacter() ( 
if (cursor-»link != NULL) ( 
Cell *oldCell = cursor-»link; 
cursor-»link = cursor-»link-»link; 
delete oldCell; 


Implementation notes: getText and getCursor 


The getText method uses the standard linked-list pattern to loop 
through the cells in the linked list. The getCursor method counts 
the characters in the list until it reaches the cursor. 


*/ 


string EditorBuffer::getText() const { 
string str - ""; 
for (Cell *cp = start-»link; cp !- NULL; cp = cp->link) ( 
str += cp->ch; 
} 


return str; 


} 


int EditorBuffer::getCursor() const { 
int nChars = 0; 
for (Cell *cp = start; cp != cursor; cp = cp->link) ( 
nChars++; 
} 


return nChars; 





图 13-9 (48) 


13.5.5 ”基于 链表 的 缓冲 区 的 时 间 复杂 度 
从 前 面 的 讨论 可 以 看 出 ， 在 复杂 度 那 张 表 里 加 一 列 是 很 容易 的 。 可 以 用 这 列 以 缓冲 区 中 
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字符 数目 来 表示 基本 编辑 操作 的 代价 。 这 个 包含 缓冲 区 三 种 实现 的 时 间 复 杂 度 数据 的 新 表 如 
表 13-4 所 示 。 


表 13-4 三 种 缓冲 区 模型 的 时 间 复 杂 度 表 


a * | ma | » J =x 


moveCursorBackward O(N) 
moveCursorToStart O(1) 


遗憾 的 是 ， 在 链表 结构 的 表示 中 ,仍然 有 moveCursorBackward fll moveCursorToEnd 
这 两 个 复杂 度 为 O(N) 的 操作 。 这 种 表示 的 问题 是 在 实现 的 时 候 链表 指针 的 方向 是 强制 规定 
的 : 光标 前 移 比较 容易 ， 因 为 指针 的 指向 就 是 向 前 的 。 


13.5.6 ”双向 链表 

好 消息 是 这 个 问题 比较 容易 解决 。 为 了 解决 链表 只 能 向 一 个 方向 前 进 的 问题 ， 你 需要 使 
指针 可 以 双向 地 移动 。 除 了 让 每 个 结 点 有 一 个 可 以 指向 下 一 个 结 点 的 指针 ， 你 也 应 该 包含 一 
个 指向 它 前 一 个 结 点 的 指针 。 这 种 结构 被 称 为 双向 链表 (double linked list). 

双向 链表 的 每 个 结 点 都 有 两 个 指针 ， 一 个 prev 指针 域 指向 当前 结 点 的 前 一 个 结 点 ， 另 
一 个 next 指针 域 指向 其 下 一 个 结 点 。 因 此 当 你 实现 之 前 的 操作 时 ， 就 会 比较 清晰 。 如 果 空 
结 点 的 prev 指针 指向 缓冲 区 的 最 后 ， 并 且 最 后 一 个 结 点 的 next 指针 指向 空 结 点 ， 那 么 就 
能 简化 链表 的 操作 。 

如 果 你 采用 这 种 设计 ， 使 用 双 链表 实现 的 缓冲 区 中 若 包 含 以 下 内 容 : 


ABC 
^ 


看 起 来 就 如 下 图 所 示 : 





在 这 个 图 中 有 很 多 指针 ， 这 令 人 困惑 。 另 一 方面 ， 这 个 结构 包含 了 你 所 需要 的 所 有 信 
息 ， 这 些 信息 可 以 让 每 个 基本 编辑 操作 都 可 以 在 常数 时 间 内 完成 。 然 而 ， 最 终 的 实现 就 留 作 
一 道 习题 ， 这 样 可 以 强化 你 对 双向 链表 的 理解 。 


13.5.7 “时空 权衡 


你 可 以 实现 EditorBuffer 类 ， 并且 使 得 标准 的 编辑 操作 都 可 以 在 常数 时 间 内 运行 ， 
这 是 一 个 很 重要 的 理论 性 成 果 。 遗 憾 的 是 ， 这 个 结果 在 实际 使 用 中 可 能 并 不 是 很 有 用 。 至 少 
在 编辑 器 这 个 应 用 环境 中 是 这 样 。 当 你 开始 考虑 在 双向 链表 的 每 一 个 结 点 都 增加 一 个 Prev 
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指针 的 时 候 ， 你 就 要 至 少 多 使 用 九 个 字 节 的 内 存 来 表示 每 个 字符 。 你 可 能 能 够 很 快 地 执行 编 
辑 操作 ， 但 你 消耗 内 存 的 速度 也 是 惊人 的 。 此 时 ， 你 就 遇 到 了 被 计算 机 科学 家 称 为 时 空 权衡 
(time-space tradeoff) 的 问题 。 你 可 以 提高 算法 的 计算 效率 ， 但 是 这 样 做 是 以 耗费 内 存 为 代 
价 的 。 耗 费 内 存 是 很 严重 的 问题 ， 例 如 ， 它 意味 着 你 在 机 器 上 可 以 编辑 的 最 大 文件 的 大 小 只 
是 你 使 用 数组 表示 所 占用 的 内 存 空间 的 十 分 之 一 。 

在 现实 环境 中 出 现 这 种 情况 时 ， 你 可 能 就 需要 采用 一 种 混合 策略 。 这 样 可 以 让 你 在 时 空 
权衡 中 选择 一 个 中 间 点 。 例 如 ， 你 可 以 通过 将 缓冲 区 按 行 划分 成 双向 链表 ， 然 后 每 一 行 又 用 
数组 来 表示 的 方式 将 数组 与 双向 链表 策略 相 结 合 。 这 样 的 话 ， 插 入 操作 在 每 一 行 的 开始 会 比 
较 慢 ， 但 仅仅 是 在 每 一 行 而 不 是 整个 缓冲 区 域 。 另 一 方面 ， 这 个 策略 的 每 一 行 需要 一 个 指针 
而 不 是 每 个 字符 都 需要 指针 。 因 为 一 行 通 常 由 很 多 字符 构成 ， 使 用 这 种 方法 就 会 减少 相当 多 
的 内 存 。 在 混合 策略 中 把 所 有 细节 都 权衡 好 是 很 有 挑战 的 ， 但 是 知道 存在 这 种 方法 也 是 很 重 
要 的 ， 并 且 也 存在 既 可 以 提高 算法 的 时 间 效 率 也 没有 使 用 大 量 内 存 的 方法 。 


本 章 小 结 

尽管 本 章 的 主要 内 容 是 对 编辑 器 缓冲 区 实现 一 个 类 的 表示 ， 但 编辑 器 本 身 并 不 是 重点 。 
包含 一 个 光标 位 置 的 文本 缓冲 区 只 在 一 个 相对 较 小 的 应 用 领域 比较 有 用 。 用 来 提高 缓冲 区 表 
示 方 法 的 独特 的 技巧 才 是 你 日 后 会 反复 使 用 的 东西 。 

本 章 的 重点 内 容 包括 : 
表示 一 个 类 所 使 用 的 策略 对 它 操作 的 时 间 复 杂 度 有 很 大 影响 。 
e 尽管 数组 为 编辑 器 缓冲 区 提供 了 一 个 可 用 的 表示 方法 ， 但 你 可 以 通过 使 用 其 他 的 表 
示 策 略 来 提高 它 的 性 能 。 例 如 ， 使 用 一 对 栈 ， 通 过 以 光标 移动 很 长 距离 为 代价 从 而 
简化 了 插入 与 删除 操作 。 
你 可 以 通过 给 每 个 结 点 存储 一 个 指针 让 它 指向 该 结 点 的 下 一 个 结 点 的 方法 来 表示 结 
点 的 先后 次 序 。 在 编程 中 ， 这 样 设计 的 结构 称 为 链表 。 连 接 下 一 个 值 的 指针 被 称 为 
链 ， 用 来 存储 值 和 指针 的 单个 记录 称 为 结 点 。 
标记 链表 末尾 的 传统 方法 是 将 最 后 一 个 结 点 的 指针 设 为 常量 NULL。 
如 果 在 一 个 链表 中 插入 和 删除 值 ， 在 链表 的 开头 分 配 一 个 空 结 点 是 非常 方便 的 。 这 种 
方法 的 优点 就 在 于 : 空 结 点 的 存在 减少 了 我 们 在 代码 中 要 考虑 的 特殊 情况 的 数目 。 
在 链表 的 一 个 特定 的 位 置 进行 插入 和 删除 操作 所 用 的 时 间 是 常数 时 间 。 
你 可 以 通过 如 下 的 方式 对 链表 的 结 点 进行 迭代 操作 : 
for (Cell *cp = list; cp != NULL; cp = cp->link) ( 

00 REG CP... 


) 

双向 链表 可 以 使 我 们 在 前 后 两 个 方向 有 效 地 遍历 链表 。 

链表 在 执行 时 间 上 比较 高 效 , 但 比较 浪费 内 存 。 在 有 些 情 况 下 ,你 可 能 需要 采用 泥 
合 策略 进行 设计 ， 这 个 策略 允许 你 将 节约 内 存 的 数组 策略 和 执行 比较 高 效 的 链表 策 
略 相 结合 。 


复习 题 
1. 判断 题 : 程序 的 时 间 复杂 度 仅仅 取决 于 算法 结构 ， 与 数据 的 表示 结构 无 关 。 


410 £13* 


2. wysiwyg 是 什么 意思 ? 


3. 用 自己 的 语言 描述 本 章 使 用 缓冲 区 抽象 的 目的 。 

4. 编辑 器 应 用 实现 的 六 个 命令 是 什么 ? 在 EditorBuffer 类 中 相对 应 的 公有 方法 是 什么 ? 

5. 除了 和 编辑 器 命令 中 相对 应 的 方法 以 外 ，EditorBuffer 类 还 提供 哪些 其 他 的 公有 操作 ? 

6. 在 用 数组 表示 的 编辑 器 缓冲 区 中 ， 哪 种 编辑 操作 所 用 的 时 间 是 线性 的 ?导致 这 些 操 作 缓 慢 的 原因 是 
什么 ? 

7. 如 下 图 所 示 ， 有 一 块 缓冲 区 域 ， 它 的 内 容 如 下 : 


ABCDEFGHIJ 


光标 位 置 如 图 所 示 。 用 两 个 栈 表 示 这 块 缓冲 区 域 。 画 图 表示 before 和 after 栈 中 的 内 容 。 
8. 用 两 个 栈 表示 的 编辑 器 缓冲 区 中 的 光标 位 置 是 如 何 表示 的 ? 
9. 在 两 个 栈 表示 的 编辑 器 缓冲 区 中 ， 哪 种 编辑 操作 所 用 的 时 间 是 线性 的 ? 
10. 在 用 链表 表示 编辑 器 缓冲 区 时 ， 使 用 空 结 点 的 目的 是 什么 ? 
11. 为 什么 空 结 点 会 处 于 链表 的 开始 或 未 尾 ? 
12. 将 一 个 新 的 字符 插入 到 用 链表 表示 的 缓冲 区 中 ， 需 要 进行 哪 五 步 ? 
13. 一块 缓冲 区 域 包含 如 下 内 容 : 


HELLO 
^ 


光标 位 置 如 图 所 示 ， 且 该 缓冲 区 用 链表 表示 。 画 一 个 图 表示 该 链表 的 每 一 个 结 点 。 

14. 如 果 在 光标 的 位 置 插入 字母 x， 修 改 之 前 画 的 图 ， 看 看 有 何 变化 ? 

15. 遍历 链表 是 什么 意思 ? 

16. 用 C++ 遍历 链表 的 标准 模式 是 什么 ? 

17. 在 编辑 器 缓冲 区 的 链表 表示 中 ， 哪 种 编辑 操作 所 用 的 时 间 是 线性 的 ?导致 这 些 操作 比较 慢 的 原因 是 
什么 ? 

18. 时 空 权 衡 是 什么 意思 ? 

19. 你 可 以 对 链表 结构 做 何 种 修改 ， 才 能 使 得 其 执行 六 个 操作 的 时 间 都 为 常数 时 间 ? 

20. 上 一 题 所 给 的 答案 有 什么 主要 的 缺点 ? 你 可 以 如 何 对 其 进行 改进 ? 

习题 

1. 尽 管 SimpleTextEditor 应 用 在 说 明 编辑 器 的 工作 原理 时 比较 有 用 ， 但 它 不 是 一 个 理想 的 测试 程 
序 ， 因 为 它 依赖 于 用 户 明确 的 输入 。 为 EditorBuffer 类 设计 和 实现 一 个 单元 测试 ， 并 且 要 求 该 
单元 测试 能 测试 实现 过 程 中 的 所 有 可 能 错误 。 

2. 尽管 基于 两 个 栈 实现 的 EditorBuffer 类 中 的 栈 是 动态 扩展 的 。 但 是 栈 中 字符 所 需 的 空间 是 相应 数 
组 实现 的 两 倍 。 导 致 这 个 问题 的 主要 原因 是 两 个 栈 都 要 能 够 放 人 缓冲 区 中 的 所 有 字符 。 例 如 ， 假 设 你 
在 使 用 一 个 是 有 N 个 字符 的 缓冲 区 。 如 果 光 标 在 缓冲 区 开头 ， 那 么 所 有 字符 都 要 放 人 after 栈 ; 如 
果 光 标 移动 到 缓冲 区 最 末尾 ， 这 些 字符 又 需要 移动 到 before 栈 。 因 此 ， 每 个 栈 的 容量 至 少 为 N。 


你 可 以 通过 将 两 个 栈 存 人 一 个 数组 的 相反 方向 来 减少 内 存 的 使 用 。before 栈 放 在 数组 的 开头 ， 
after 栈 放 在 数组 的 末尾 。 然 后 两 个 栈 就 会 按照 图 中 箭头 所 示 的 方向 增长 : 


before —> *— after 


用 这 种 表示 方法 重新 实现 EditorBuffer 类 (实际 上 ， 现 在 很 多 编辑 器 都 使 用 这 种 设计 方法 )。 确 
保 你 的 程序 和 文中 两 个 栈 的 实现 有 相同 的 计算 效率 ， 并 且 缓 冲 区 空间 是 随 着 需要 动态 增长 的 。 


3. 如 果 使 用 一 个 实际 的 编辑 器 应 用 ， 你 可 能 希望 程序 展示 缓冲 区 的 内 容 ， 而 不 是 每 一 个 命令 。 改 变 


SimpleTextEditor 应 用 的 实现 ， 使 它 不 再 展示 每 个 命令 之 后 的 缓冲 区 ， 而 是 提供 一 个 了 命令 输 
出 内 容 。 与 图 13-3 中 包含 的 displayBuffer 函数 相反 ,TT 命令 仅仅 以 字符 串 的 形式 输出 缓冲 区 
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的 内 容 ， 不 需要 显示 光标 的 位 置 。 新 的 编辑 器 应 用 的 一 个 运行 示例 如 下 图 所 示 : 
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4. SimpleTextEditor 应 用 中 一 个 很 重要 的 限制 就 是 不 能 在 缓冲 区 里 插 人 换行 符 。 因 此 就 不 能 写 人 
多 于 一 行 的 数据 。 从 习题 3 开始 ， 编 辑 器 中 增加 了 一 个 &R 命令 ， 它 可 以 读 取 随 后 多 行 的 文本 ， 和 
UNIX 系统 中 的 ed 编辑 器 一 样 ， 当 用 户 输入 一 个 单独 句号 表示 结束 。 这 种 版 本 的 编辑 器 的 一 个 示例 


运行 可 能 如 下 图 所 示 : 


*A 

"Twas brillig, and the slithy toves 
Did gyre and gimble in the wabe: 
All mimsy were the borogoves, 

And the mome raths outgrabe. 


*J 
*A 
JABBERWOCKY 
| -一 Lewis Carroll 


*T 
JABBERWOCKY 
-- Lewis Carroll 
|'Twas brillig, and the slithy toves 
|Did gyre and gimble in the wabe: 
|All mimsy were the borogoves, 


And the mome raths outgrabe. 
* 


M Ü——ÓÀ 
5. ESA 13-3 所 示 的 编辑 器 应 用 。 使 得 在 F、B 和 D 命令 之 前 可 以 添加 一 个 数字 ， 以 便 这 些 命令 重复 
执行 由 该 数字 指定 的 次 数 。 例 如 ， 命 令 17F 将 会 把 光标 向 前 移动 17 个 字符 位 置 。 
6. 扩展 编辑 器 应 用 ， 使 得 F、B 和 D 命令 可 以 出 现在 字母 W 之 前 表示 他 们 是 移动 操作 。 因 此 ，WEF 命令 
就 是 将 光标 移动 到 下 一 个 单词 的 末尾 ，WB 表示 将 光标 返回 到 上 一 个 单词 的 开头 ，WD 表示 删除 下 一 
个 单词 。 为 了 实现 这 个 练习 ， 假 设 一 个 单词 由 连续 的 字母 或 数字 序列 组 成 ， 并 且 在 光标 和 单词 之 间 
可 包含 任意 的 非 字母 字符 。 用 下 面 的 例子 就 能 很 容易 理解 : 


MM 


*1This is x aa, 插入 一 段 文本 。 T 


THX is a test. 


” 将 光标 回 退 一 个 单词 。 








MPO OACONOT 





*WB 
This is a test 
^ 


This ia a t... 将 光标 跳 到 所 插入 文 本 的 开始 处 。 ， 
"ais is a test. 将 光标 移动 到 第 一 个 单词 的 未 尾 。 | 
eh ie i s a test. 将 光标 移动 到 第 二 个 单词 的 末尾 。 | 
*WD 

This is test. 删除 光标 后 的 空格 及 下 一 个 单词。 
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实现 这 些 命令 最 直接 的 方法 就 是 扩充 EditorBuffer 类 ， 使 它 可 以 导出 那些 完成 基于 单词 操作 的 
方法 ， 这 些 方法 是 由 你 设计 的 。 用 本 章 介绍 的 三 种 缓冲 区 表示 法 分 别 实现 这 些 扩 展 。 

大 多 数 现代 编辑 器 提供 了 一 种 机 制 ， 它 允许 用 户 把 缓冲 区 文本 的 一 部 分 复制 到 内 存 ， 然 后 再 把 它 粘 
贴 到 其 他 地 方 。 本 章 所 给 的 三 种 表示 缓冲 区 的 方法 ， 以 下 实现 方法 : 


void EditorBuffer::copy(int count); 


这 个 方法 保存 了 缓冲 区 内 部 结构 中 某 处 的 字符 ， 并 且 以 下 方法 : 


void EditorBuffer: :paste() ; 


可 以 将 那些 保存 的 字符 插入 到 当前 光标 的 位 置 。 调 用 paste 方法 不 会 影响 保存 的 文本 ， 这 就 意味 
着 你 可 以 通过 多 次 调用 paste 将 其 插入 多 次 。 通 过 在 编辑 器 中 添加 C 和 P 命令 来 表示 复制 和 粘贴 
操作 ， 然 后 利用 这 两 个 操作 来 测试 你 的 实现 。 同 样 ， 和 习题 5 中 使 用 的 方法 相同 ，c 命令 需要 获取 
一 个 指定 字符 数目 的 数值 参数 。 


. 之 前 习题 描述 的 支持 复制 - 粘贴 机 制 的 编辑 器 通常 会 提供 第 三 种 名 为 剪 切 的 操作 。 剪 切 操作 可 以 对 缓 


冲 区 的 内 容 先进 行 复制 然后 再 删除 。 实 现 一 个 新 的 编辑 器 命令 X， 在 对 习题 7 中 的 EditorBuffer 
类 的 接口 不 做 任何 修改 的 情况 下 实现 剪 切 操作 。 


. 用 本 章 所 给 的 三 种 表示 缓冲 区 方法 中 的 任 一 种 实现 以 下 方法 : 


bool EditorBuffer::search(string str); 


当 这 个 方法 被 调用 时 ， 它 就 从 当前 的 光标 位 置 开 始 搜索 ， 寻 找 下 一 个 字符 串 str 的 位 置 。 如 果 找 
到 ， 光 标 就 会 放 在 字符 串 str 的 最 后 一 个 字符 后 面 ， 并且 返回 true， 否 则 光标 位 置 保持 不 变 ， 返 
回 false。 

为 了 说 明 search 操作 ,假设 你 需要 在 editor .cpp 程序 中 添加 命令 S 来 调用 search 
方法 ， 就 会 将 它 传人 到 输入 行 的 剩余 部 分 。 你 的 程序 运行 结果 要 和 下 面 例子 中 程序 运行 的 结果 
相符 : 


*ITo Erik Roberts 
To Erik Roberts 
^ 


将 光标 跳 到 所 插入 文本 的 开始 处 。 D 


Roberts 


找到 字符 串 “Erik”, 并 将 光标 
放 在 该 单词 之 后 。 


回 退 光标 一 个 字符 。 

删除 字符 “k” 

添加 字符 “c” 

再 次 查找 “Erik” 时 将 不 起 作用 ， 


因为 在 光标 后 没有 与 之 相 匹配 的 
单词 。 | 





10. 在 对 习题 9 中 的 EditorBuffer 类 的 接口 不 做 任何 改变 的 前 提 下 ， 在 编辑 器 的 应 用 中 添加 一 个 R 


命令 。 当 两 个 字符 串 中 间 用 斜 线 隔 开 时 ， 该 命令 可 以 用 斜 线 后 面 的 字符 串 代替 斜 线 前 面 的 字符 串 。 
如 下 图 所 示 : 
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*ITo Erik Roberts 
To Erik Roberts 
^ 







To Erik Roberts 
^ 


*RErik/Eric $ 
To Eric Roberts tee 
^ A 


* 





——— ————  —— 
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11. 书 中 介绍 的 空 结 点 策略 是 非常 有 用 的 ， 因 为 它 减 少 了 代码 中 特殊 情况 发 生 的 数目 ， 但 是 严格 来 说 是 
不 必要 的 。 编 写 一 个 新 的 链表 版 本 的 buffer .cpp 实现 ， 要 做 到 如 下 改变 : 
e 链表 中 不 存在 空 结 点 ， 每 个 结 点 只 允许 存储 一 个 字符 。 
。 光标 处 在 第 一 个 字符 之 前 的 缓冲 区 表明 了 cursor 指针 存储 的 是 NULL. 
© 每 个 检查 光标 位 置 的 方法 在 当前 情况 下 的 任何 操作 都 要 对 NULL 做 一 次 特殊 的 检查 。 

12. 用 13.5.6 节 中 所 说 的 双向 链表 方法 实现 EditorBuffer 类 。 尽 可 能 彻底 地 测试 你 的 程序 。 尤 其 要 
保证 你 在 当前 进行 插入 和 删除 的 地 方 可 以 让 光标 向 两 个 方向 移动 。 


EE 


Programming Abstractions in C++ 


线性 结构 


我 从 来 都 没有 遇 到 过 像 那 样 很 直 的 线 ; 它 有 一 两 个 次, 但 是 这 没什么 大 不 了 的 。 
简 . ACT, (OX E )(Persuasion), 1818 





在 第 5 章 介绍 的 Stack, Queue fll Vector 类 都 被 称 为 线性 结构 (linear structure) 的 
一 类 抽象 数据 类 型 的 实例 ， 线 性 结构 中 的 元 素 都 以 线性 的 顺序 排列 。 本 章 着 眼 于 这 些 类 型 的 
几 种 可 能 表示 方法 ， 并 思考 表示 方法 的 选择 对 效率 的 影响 。 

由 于 一 个 线性 结构 中 的 元 素 是 按 像 数组 顺序 排列 的 ， 使 用 数组 表示 它们 似乎 是 一 个 显 而 
易 见 的 选择 。 的 确 ， 第 12 章 展示 的 CharStack 类 是 通过 使 用 一 个 数组 作为 基本 表示 而 实 
现 的 。 然 而 ， 数 组 并 不 是 唯一 的 选择 。 栈 、 队 列 和 矢量 也 可 以 使 用 一 种 类 似 第 13 章 用 于 实 
现 编辑 器 缓冲 区 的 链表 来 实现 。 通 过 学 习 这 些 结构 的 链表 实现 方法 ， 你 不 仅 能 提高 对 链表 如 
何 工作 的 理解 ， 也 能 提高 对 如 何 能 将 它们 应 用 到 实际 编程 情况 中 的 理解 。 

本 章 还 有 另外 一 个 目的 。 正 如 你 从 第 5 章 了 解 到 的 ， 容 器 类 (不 像 第 12 章 的 
CharStack 类) 并 不 局 限于 单一 的 数据 类 型 。 实 际 的 Stack 类 人 允许 用 户 通过 提供 一 个 类 型 
参数 来 指定 基 类 型 ， 正 如 Stack<int> 和 Stack<Point> 一 样 。 然 而 ， 到 目前 为 止 ， 作 
为 用 户 的 你 只 有 使 用 参数 化 类 型 的 机 会 。 而 在 本 章 ， 你 将 学 习 如 何 实现 它们 。 


14.1 模板 


在 计算 机 科学 中 ， 能 将 相同 的 代码 应 用 到 多 种 数据 类 型 上 的 方式 称 为 多 态 
(polymorphism)。 程 序 语言 可 以 用 多 种 方式 实现 多 态 。 C++ 使 用 了 一 种 被 称 为 模板 (template) 
的 方法 ， 使 用 这 种 方法 ， 程 序 员 定义 了 一 个 共同 的 代码 模式 之 后 ， 这 个 模式 就 可 以 被 用 于 许 
多 不 同 的 类 型 。 第 5 章 的 容器 类 依赖 于 C++ 模板 的 功能 ， 这 意味 着 在 你 能 够 领会 容器 类 的 
底层 实现 方法 之 前 ， 需 要 懂得 模板 是 如 何 工作 的 。 

在 详细 地 理解 模板 之 前 ， 重 温 第 2 章 介绍 的 重 载 概念 是 很 有 帮助 的 。 只 要 这 些 函 数 可 以 
通过 它们 的 参数 加 以 区 分 ， 重 载 就 允许 你 用 相同 的 名 字 定 义 不 同 的 函数 。 给 定 一 个 特定 的 函 
数 调用 ， 编 译 器 通过 观察 实 参 的 数目 和 类 型 以 选择 和 签名 相 匹配 的 函数 版 本 。 

作为 一 个 例子 ， 你 可 以 使 用 下 面 的 代码 来 定义 名 为 max 函数 的 两 个 版 本 (一 个 用 于 整 


数值 ， 另 一 个 用 于 浮 点 数值 )， 它 返回 两 个 参数 中 较 大 者 。 


int max(int x, int y) ( 
return (x > y) ? x: y; 


} 


double max(double x, double y) { 
return (x > y) ? x: y; 


) 
这 两 个 函数 体 是 完全 相同 的 。 唯 一 不 同 的 是 参数 签名 。 如 果 用 户 编 写 了 函数 调用 : 


max(17, 42) 
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则 编译 器 注意 到 它 的 两 个 实 参 都 是 整数 ， 因 此 会 发 出 调用 max 形 参 为 整数 的 函数 版 本 ， 它 
将 返回 一 个 int 类 型 的 结果 。 相 比 之 下 ,调用 以 下 函数 : 


max(3.14159, 2.71828) 


将 产生 一 个 浮 点 数 版 本 max 函数 的 调用 ， 它 将 返回 一 个 double 类 型 的 结果 。 

当 只 有 函数 参数 的 数据 类 型 不 同时 ， 模 板 才 使 得 自动 函数 重 载 变 为 可 能 。 在 C++ 中 ， 
你 可 以 将 前 面 的 max 函数 定义 合并 成 一 个 单独 的 模板 定义 ， 如 下 所 示 : 

template «typename ValueType» 

ValueType max(ValueType x, ValueType y) ( 


return (x > y) ?x : y; 


} 


在 上 述 定 义 中 ， 标 识 符 ValueType 对 于 max 调用 使 用 的 参数 类 型 来 说 是 一 个 占 位 符 。 关 
键 字 typename 告诉 C++ 编译 器 这 个 占 位 符 表 示 一 个 类 型 的 名 字 ， 它 使 得 编译 器 能 够 正确 
地 解释 该 标识 符 。 

一 旦 你 定义 了 该 函数 模板 ， 就 可 以 将 它 应 用 到 任何 的 基本 类 型 中 。 例 如 ， 如 果 编 译 器 遇 
到 以 下 函数 调用 : 

max('A', 'Z') 
它 会 自动 地 产生 max 的 一 个 字符 版 本 ， 如 下 所 示 : 

char max (char x, char y) ( 

return (x > y) ?x : y; 

) 
然后 编译 器 就 能 将 一 个 调用 插入 到 这 个 新 创建 的 max 版 本 中 ， 它 会 正确 地 返回 字符 'z' 作 
为 表达 式 max('A', 'Z') 的 值 。 

max 函数 模板 版 本 适用 于 任何 定义 了 > 操作 符 的 数据 类 型 。 例 如 ， 如 果 你 扩展 第 6 章 
习题 7 描述 的 Rational 类 ， 使 得 它 包 含 比 较 操 作 符 ， 你 就 可 以 使 用 max 函数 选择 两 个 
Rational 对 象 中 较 大 的 那个 。 模 板 意味 着 在 新 数据 类 型 上 使 用 max 函数 是 无 需 编写 更 多 
代码 的 。 

然而 ， 有 一 些 地方 需 要 小 心 。 假 设 运行 在 机 器 上 的 编译 器 调用 : — 


正好 返回 "cat", 这 看 起 来 和 逻辑 结果 相反 。 这 里 的 问题 是 字面 值 cat" 和 "dog" 都 是 C 
字符 串 而 不 是 C++ 字符 串 ， 这 意味 着 它们 是 指向 字符 的 指针 。 因 此 ，C++ 编译 器 产生 了 或 
多 或 少 无 用 的 函数 : 

char *max(char *x, char *y) ( 


return (x > y) ? x: y; 


} 


该 函数 将 返回 存储 在 内 存 中 更 高 地 址 的 C 字符 串 的 地 址 。 相 比 于 "qog" 中 的 字符 ， 编 译 器 
将 "cat" 中 的 字符 存储 在 更 高 的 地 址 中 ， 然 后 "cat" 将 作为 最 大 值 返回 。 为 了 使 用 关于 
C++ 字符 串 定 义 的 字符 串 比较 操作 符 ， 你 需要 编写 如 下 的 函数 调用 : 
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max(string("cat"), string("dog")) 
它 会 正确 地 返回 C++ 字符 串 "dog". 

值得 注意 的 一 个 有 趣事 实 是 : 实际 上 ， 相 比 于 单独 定义 函数 的 重 载 版 本 的 选择 策略 ， 模 
板 的 功能 并 没有 节省 任何 空间 。 编 译 器 无 论 何 时 遇 到 一 个 它 没有 见 过 的 类 型 函数 模板 的 应 
用 ， 都 会 产生 一 个 全 新 的 相应 数据 类 型 的 函数 拷贝 。 因 此 ， 如 果 你 使 用 相同 的 程序 将 max 
PRU HIS] int, double, char, string 和 Rational 类 型 中 ,编译 器 将 产生 5 个 函 
数 代码 的 拷贝 ， 每 种 类 型 一 个 。 这 种 实现 策略 强调 了 为 什么 单词 “template” 是 如 此 的 合适 。 
在 C++ 中， 你 不 能 定义 单一 的 函数 用 于 多 种 数据 类 型 ， 而 是 应 该 提供 一 个 模板 ， 从 中 编译 
器 会 产生 它们 需要 的 专门 定制 的 版 本 。 

编译 器 需要 创建 模板 代码 的 多 种 拷贝 ， 作 为 一 个 程序 员 ， 这 个 事实 对 你 有 重要 的 意义 。 
在 C++ 中， 当 编 译 器 遇 到 一 个 函数 模板 调用 时 ， 该 模板 必须 能 够 实现 。 原 型 本 身 是 不 够 
的 。 这 个 约束 意味 着 你 不 能 将 接口 和 一 个 函数 模板 的 实现 分 开 ， 本 书 中 的 程序 通常 将 原型 放 
TE .n 文件 中 ， 而 将 相应 的 实现 放 在 .cpp 文件 中 。 如 果 你 想 输 出 一 个 函数 模板 作为 库 的 一 
部 分 ， 对 于 编译 器 来 说 ， 当 .n 文件 被 读 取 时 ， 函 数 实现 必须 是 有 效 的 。 


14.2 RAH 


第 12 章 中 的 charStack 类 定义 了 各 种 类 型 的 栈 所 需要 的 相关 操作 ， 但 是 它 有 这 样 
一 个 限制 : 它 只 能 存储 char 类 型 的 元 素 。 为 了 获得 Stack 类 库 版 本 的 灵活 性 ， 有 必要 将 
Stack 类 作为 一 个 模板 类 (template class) 重新 实现 ， 模 板 类 是 一 个 使 用 C++ 模板 机 制 的 
类 ， 它 可 以 适用 于 任意 数据 类 型 。 

创建 一 个 已 有 的 类 模板 形式 涉及 一 些 简单 的 语法 变换 。 例 如 ， 如 果 你 想 使 用 一 个 通用 的 
Stack 模板 来 更 新 第 12 章 的 charStack 类 ， 你 首先 需要 将 名 字 CharStack 用 Stack 
替换 ， 然 后 在 类 定义 前 添加 以 下 一 行 语句 : 


template «typename ValueType» 


template 关键 字 表 示 这 一 行 后 面 的 整个 语法 单位 (在 这 种 情况 下 ， 类 的 定义 ) 是 模板 模 
式 的 一 部 分 ， 模板 模式 可 以 被 用 于 ValueType 参数 的 许多 不 同 值 。 例 如 ， 在 Stack 类 
的 代码 中 ， 涉 及 存储 元 素 类 型 的 地 方 需 要 使 用 名 为 ValueType 的 占 位 符 。 因 此 ， 当 你 将 
CharStack 类 定义 转换 成 它 的 更 一 般 的 模板 形式 时 ， 你 必须 将 每 一 个 出 现 的 特定 类 型 char 
用 通用 的 占 位 符 ValueType 替换 。 

stack.h 接口 更 新 后 的 版 本 显示 在 图 14-1 中 ， 它 只 包括 一 些 独立 于 策略 实现 之 外 的 
公共 定义 。 这 些 定 义 毕 竟 只 是 用 户 感 兴趣 的 接口 文件 的 一 部 分 。 正 如 第 13 BM buffer.nk 
口 列举 的 ，stack 类 私有 部 分 是 作为 一 个 框 出 现 的 ， 之 后 它 将 被 适合 于 特定 表示 的 定义 所 
代替 。 然 而 ，Stack 是 一 个 模板 类 的 事实 也 意味 着 编译 器 必须 使 用 该 实现 以 及 类 定义 本 身 。 
因此 ， 图 14-1 是 以 第 二 个 框 结束 的 ， 它 最 终 将 被 相对 应 的 选择 表示 的 实现 所 替换 。 在 下 面 
的 章节 中 ， 这 些 框 将 被 栈 的 两 种 不 同 的 基本 表示 所 替换 : 一 个 使 用 动态 数组 表示 ; 另 一 个 则 
使 用 链表 。 


14.2.1 使 用 动态 数组 实现 栈 
实现 栈 类 模板 的 最 简单 方法 是 采用 第 12 章 CharStack 类 使 用 的 动态 数组 模型 。 正 如 前 
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/* 
* File: stack.h 


* This interface exports a template version of the Stack class. 
*f 


#ifndef _stack_h 
#define _stack_h 


#include "error.h" 


/* 
* Class: Stack<ValueType> 


* This class implements a stack of the specified value type. 
y. 


template «typename ValueType> 
class Stack ( 


public: 


Constructor: Stack 
Usage: Stack«ValueType» stack; 


Stack(); 


Destructor: ~Stack 
Usage: (usually implicit) 


~Stack (); 


Method: size 
Usage: int n stack.size(); 


Returns the number of values in this stack. 


int size() const; 


Method: isEmpty 
Usage: if (stack.isEmpty()) 


Returns true if this stack contains no elements. 
*/ 
bool isEmpty() const; 


Method: clear 
Usage: stack.clear(); 


Removes all elements from this stack. 
*/ » 


void clear(); 


Method: push 
Usage: stack.push(value); 


Pushes the specified value onto this stack. 
sy 

void push(ValueType value); 
/* 


* Method: pop 
* Usage: ValueType top = stack.pop(); 





图 14-1 关于 多 态 栈 抽象 的 接口 
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This 





* Removes the top element from this stack and returns it. 
* method signals an error if called on an empty stack. 
*/ 









ValueType pop(); 






/* 





* Method: peek 
* Usage: ValueType top - stack.peek(); 













* Returns the value of top element from this stack without removing 
* XE This method signals an error if called on an empty stack. 


Ji 






ValueType peek() const; 









/* 


* Copy constructor and assignment operator 










* These methods implement deep copying for stacks. 
y 






Stack(const Stack«ValueType» & src); 
Stack«ValueType» & operator-(const Stack«ValueType» & src); 


The private section of the class goes here. 
}; 





The implementation of the class goes here. 


#endif 





图 14-1 ( 续 ) 


面 的 例子 所 示 ，Stack 的 底层 实现 必须 跟踪 动态 数组 的 元 素 、 数 组 的 大 小 和 当前 元 素 的 个 
数 。 类 的 私有 部 分 包括 这 些 变量 的 声明 ， 以 及 一 个 私有 的 定义 初始 大 小 的 常量 和 私有 方法 的 
原型 。 关 于 基于 数组 实现 的 栈 的 私有 部 分 显示 在 图 14-2 H, 


Private section */ 


Implementation notes 


This version of the stack.h interface uses a dynamic array to store 
the elements of the stack. The array begins with INITIAL CAPACITY 
elements and doubles the size whenever it runs out of space. This 
discipline guarantees that the push method has O(1) amortized cost. 
ri 


private: 
static const int INITIAL_CAPACITY = 10; 


Instance variables */ 


ValueType *array; /* A dynamic array of the elements */ 
int capacity; /* The allocated size of the array */ 
int count; /* The number of stack elements */ 


Private method prototypes */ 


void deepCopy (const Stack<ValueType> & src); 
void expandCapacity(); 





图 14-2 ”基于 数组 的 栈 私 有 部 分 


模板 类 对 一 般 类 型 更 加 适用 ， 用 valueType 替换 char 和 变换 变量 名 在 类 型 转换 过 
程 中 是 一 个 很 大 的 问题 ， 例 如 ， 在 charstack 实现 中 ， 将 原 有 变量 名 ch 处 替换 为 名 为 
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value 将 更 有 意义 。 在 Stack 类 的 模板 版 本 中 唯一 实质 的 变化 是 : 实现 了 拷贝 构造 函数 和 赋 
值 操作 符 的 重 载 版 本 ， 从 而 确保 了 用 户 可 以 拷贝 Stack 类 型 的 值 。stack.h 的 实现 部 分 显 "M 
示 在 图 14-3 中 。 622 


Implementation section 


C++ requires that the implementation for a template class be availabl| 
to the compiler whenever that type is used. The effect of this 
restriction is that header files must include the implementation. 
Clients should not need to look at any of the code beyond this point. 


Implementation notes: Stack constructor 


The constructor allocates the array storage for the stack elements 
and initializes the fields of the object. 


template «typename ValueType» 

Stack«ValueType»::Stack() ( 
capacity = INITIAL CAPACITY; 
array - new ValueType[capacity]; 
count - 0; 


Implementation notes: ~Stack 


The destructor frees any heap memory allocated by the class, which 
is just the dynamic array of elements. 


template <typename ValueType> 

Stack<ValueType>::~Stack() { 
delete[] array; 

} 


template <typename ValueType> 
int Stack<ValueType>::size() const { 
return count; 


} 


template <typename ValueType> 
bool Stack«ValueType»::isEmpty() const ( 
return count -- 0; 


) 


template «typename ValueType» 
void Stack«ValueType»::clear() ( 
count - 0; 


} 
/* 


* Implementation notes: 


* This function first checks to see whether there is enough room for 
* the value and then expands the array storage if necessary. 
*2 
template «typename ValueType> 
void Stack«ValueType»::push(ValueType ch) ( 
if (count == capacity) expandCapacity(); 
array[count-*] = ch; 


) 


/* 
* Implementation notes: pop, peek 


These functions checks for an empty stack and reports an error 
if there is no top element. 
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template «typename ValueType» 

ValueType Stack«ValueType»::pop() ( 
if (isEmpty()) error("pop: Attempting to pop an empty stack"); 
return array[--count]; 


) 


template «typename ValueType» 

ValueType Stack<ValueType>::peek() const ( 
if (isEmpty()) error("peek: Attempting to peek at an empty stack"); 
return array[count - 1]; 


} 
/* 


* Implementation notes: copy constructor and.assignment operator 


* These methods follow the standard template, leaving the work to deepCopy. 
wf 


template «typename ValueType> 

Stack«ValueType»::Stack(const Stack<ValueType> & src) { 
deepCopy (src) ; 

) 


template «typename ValueType> 
Stack«ValueType» & Stack«ValueType»::operator-(const Stack«ValueType» & src) ( 
if (this !- &src) ( 
delete[] array; 


deepCopy (src) ; 


return *this; 


Implementation notes: deepCopy 


This function copies the data from the src parameter into the current 
object. All dynamic memory is reallocated to create a "deep copy" in 
which the current object and the source object are independent. 
The capacity is set so that the stack has some room to expand. 


template «typename ValueType> 
void Stack<ValueType>: :deepCopy (const Stack<ValueType> & src) { 
capacity = src.count + INITIAL CAPACITY; 
this-»array = new ValueType[capacity]; 
for (int i = 0; i « src.count; i++) ( 
array[i] = src.array[i]; 


count = src.count; 


/* 

* Implementation notes: expandCapacity 

* 

* This private method doubles the capacity of the elements array whenever 
* it runs out of space. To do so, it copies the pointer to the old array, 
* allocates a new array with twice the capacity, copies the values from 
* the old array to the new one, and finally frees the old storage. 
* 


/ 


template «typename ValueType> 
void Stack«ValueType»::expandCapacity() ( 
ValueType *oldArray - array; 
capacity *- 2; 
array = new ValueType[capacity]; 
for (int i = 0; i « count; i++) ( 
array[i] = oldArray[i]; 


) 
delete[] oldArray; 





图 14-3 (£X) 


14.2.2 ”使 用 链表 实现 栈 
尽管 数组 是 栈 最 常见 的 底层 表示 ,但 是 也 可 以 使 用 链表 来 实现 stack 类 。 如 果 你 这 样 
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做 ， 空 栈 的 概念 表示 则 仅仅 是 一 个 NULL 指针 : 


N 


stack 


当 你 将 一 个 新 元 素 压 人 栈 中 时 ， 元 素 仅仅 是 被 添加 到 链表 链 的 前 面 。 因 此 ， 如 果 你 将 元 
X ei 压 人 进 一 个 空 栈 中 ， 该 元 素 将 被 存储 在 一 个 新 的 节点 中 ， 并 成 为 这 个 链表 中 的 唯一 链接 。 


stack | 一 


N 


将 一 个 新 元 素 压 人 栈 ， 该 元 素 会 被 添加 到 链 首 部 。 这 个 步骤 所 涉及 的 与 将 一 个 字符 插入 
到 链表 缓存 区 所 需 的 操作 一 样 。 你 首先 需 分 配 一 个 新 的 空间 ， 然 后 输入 数据 ， 最 后 更 新 链表 
指针 ， 这 样 新 的 空间 会 变 成 链表 的 第 一 个 元 素 。 因 此 ， 如 果 你 将 元 素 es 压 人 栈 中 ， 将 获得 
以 下 结构 : 


FE 
v 


在 链表 表示 中 ，pop 操作 包含 删除 链表 中 的 第 一 个 元 素 并 返回 其 值 。 因 此 ， 上 图 所 示 的 
一 个 pop 操作 将 返回 ez， 并 回 到 栈 之 前 的 状态 ， 如 下 图 所 示 : 


stack | 一 


N 


尽管 在 栈 的 底层 实现 中 可 以 使 用 一 个 指针 指向 链表 头 部 ， 但 是 这 样 会 对 size 方法 的 效 

率 产生 不 良 影 响 。 如 果 栈 类 中 只 存储 该 链表 ， 唯 一 确定 链表 长 度 的 方法 便 是 遍历 链表 中 的 元 

素 ， 直 到 你 发 现 链表 尾 的 NULL 指针 为 止 。 这 个 过 程 需 要 O(N) 时 间 复 杂 度 。 为 了 确保 size 

方法 在 常量 时 间 内 运行 ， 最 简单 的 方法 是 使 用 一 个 单独 的 实例 变量 来 跟踪 其 元 素 的 个 数 。 采 

用 这 种 设计 意味 着 类 的 私有 部 分 声明 了 两 个 实例 变量 : 一 个 表 头 指针 和 一 个 元 素 个 数 计 数 
器 。 一 个 包含 两 个 元 素 的 栈 的 更 完整 图 如 下 图 所 示 : 

list; e— 

count} 2 | 


e 


if 
N 


基于 链表 的 栈 接口 修改 的 私有 部 分 的 内 容 显示 在 图 14-4 中 。 一 旦 你 定义 了 这 种 数据 结 
构 ， 就 可 以 继续 重 写 stack 类 方法 ,使 得 它们 在 新 的 数据 表示 方法 中 起 作用 。stack.h 接 
口 的 基于 链表 版 本 的 实现 显示 在 图 14-5 中 。 


/* Private section */ 


private: 


/* 


* Implementation notes 
* 





* This version of the stack.h interface uses a linked list to store 


图 14-4 ”基于 链表 的 栈 的 私有 部 分 
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the elements of the stack. The top item is always at the front of 
the linked list and is therefore always accessible without searching. 
The instance variable count keeps track of the number of elements so 
that the size method runs in constant time. 


/* Type for linked list cell */ 


struct Cell { 
ValueType data; The data value 
Cell *link; Link to the next cell 


Instance variables */ 


Cell *list; Initial pointer in the list 
int count; Number of elements 


Private method prototypes */ 


void deepCopy (const Stack«ValueType» 6 src); 





K 14-4 (4%) 


关于 该 实现 ， 有 几 个 方面 值得 特别 提 及 。 一 如 既往 ， 构 造 函 数 负责 建立 对 象 的 初始 状 
态 ， 初 始 状态 包括 一 个 空 链表 和 一 个 值 为 0 的 元 素 计数 器 。 图 14-5 中 的 构造 函数 明确 地 初 
始 化 了 这 些 方面 ， 如 下 所 示 : 


template <typename ValueType> 
Stack«ValueType»::Stack() ( 
list = NULL; 
count - 0; 


627 ) 


Implementation section 


C++ requires that the implementation for a template class be available 
to the compiler whenever that type is used. Clients should not need 
to look at any of the code beyond this point. 


Implementation notes: Stack constructor 


The constructor creates an empty linked list and initializes the count. 


template <typename ValueType> 
Stack«ValueType»::Stack() { 
list = NULL; 


Implementation notes: Stack destructor 


The destructor frees any heap memory that is allocated by the 
implementation. Because clear frees each element it processes, 
this implementation of the destructor simply calls that method. 


template <typename ValueType> 
Stack«ValueType»::-Stack() { 
clear (); 


} 
/* 





图 14-5 基于 链表 的 栈 的 实现 . 
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yn 
* Implementation notes: size, 

* 

* These methods use the count variable and therefore run in constant time. 


*/ 


template «typename ValueType> 
int Stack«ValueType»::size() const { 
return count; 


) 


template «typename ValueType» 
bool Stack<ValueType>::isEmpty() const { 
return count -- 0; 


} 


/* 
* implementation notes: 


* This method pops the stack until it is empty, thereby freeing each cell. 
*/ 


template «typename ValueType> 
void Stack<ValueType>::clear() { 
while (count > 0) { 
pop (); 
} 
) 


/* 


* Implementation notes: 


This method chains a new element onto the front of the list where it 
becomes the top of the stack. 
id 


template <typename ValueType> 
void Stack«ValueType»::push(ValueType value) { 


Cell *cp = new Cell; 
cp-»data - value; 
cp-»link = list; 
list = cp; 

count++; 


Implementation notes: pop, 


* These methods check for an empty stack and report an error if 
there is no top element. The pop method frees the cell to ensure 
* that the implementation does not leak memory as it executes. 


template «typename ValueType» 
ValueType Stack«ValueType»::pop() ( 
if (isEmpty()) error("pop: Attempting to pop an empty stack"); 
Cell *cp = list; 
ValueType result - cp-»data; 
list = list-»link; 
count--; 
delete cp; 
return result; 


) 


template «typename ValueType» 

ValueType Stack«ValueType»::peek() const ( 
if (isEmpty()) error("peek: Attempting to peek at an empty stack"); 
return list-»data; 

) 

/* 


* Implementation notes: copy constructor and assignment operator 


* These methods follow the standard template, leaving the work to deepCopy. 
ws 
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template <typename ValueType> 

Stack<ValueType>: : Stack (const Stack<ValueType> & src) { 
deepCopy (src) ; 

} 


template <typename ValueType> 
Stack«ValueType» & Stack«ValueType»::operator-(const Stack«ValueType» & src) ( 
if (this != &src) { 
clear(); 
deepCopy (src) ; 
) 


return *this; 


Implementation notes: deepCopy 


The deepCopy method creates a copy of the cells in the linked list. 
The variable tail keeps track of the last cell in the chain. 


template «typename ValueType» 
void Stack«ValueType»::deepCopy(const Stack«ValueType» & src) { 
count - src.count; 
Cell *tail - NULL; 
for (Cell *cp = src.list; cp != NULL; cp = cp-»link) { 
Cell *ncp - new Cell; ] 
ncp-»data = cp-»data; 
if (tail == NULL) ( 
list - ncp; 
} else { 
tail-»link = ncp; 
) 
tail - ncp; 
) 
if (tail !- NULL) tail->link = NULL; 
) 





图 14-5 (£X) 
push 方法 展示 了 将 一 个 新 结 点 添加 到 链表 头 部 的 标准 模式 : 


template «typename ValueType> 
void Stack«ValueType»::push(ValueType value) ( 
Cell *cp - new Cell; 
cp->data = value; 
cp->link = list; 
list = cp; 
countt+; 
} 


这 个 模式 十 分 重要 ， 它 值得 采用 堆 - 栈 图 来 遍历 上 述 步 又。 假设 你 正在 执行 以 下 主 程序 : 
int main() { 
Stack<int> myStack; 
myStack.push(42); 


cout << myStack.pop() «« endl; 
return 0; 


} 


当 执 行 过 程 到 达 push 调用 时 ， 堆 中 还 没有 被 分 配 任何 内 存 ， 堆 - 栈 图 看 起 来 如 下 图 所 示 : 
HE 


myStack.list 


myStack.count 
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通过 指向 当前 对 象 的 this 关键 字 、 参 数 变量 value 和 局 部 变量 cp， 调 用 myStack. 
push (42) 将 创建 一 个 新 的 栈 帧 。 这 些 参数 被 初始 化 后 ， 堆 - 栈 图 看 起 来 如 下 图 所 示 : 





myStack.list 


. [myStack.count 


EIS 


一 旦 新 的 栈 帧 准备 就 绪 ，push 方法 必须 分 配 一 个 新 的 空间 存储 值 。push 方法 中 的 第 


一 行 在 堆 中 创建 了 一 个 新 的 Cell 结构 空间 ， 并 将 它 的 地 址 赋 给 变量 cp ， 得 到 了 以 下 图 : 


value 


this 


myStack.list 






myStack.count 





i 


接 下 来 的 两 行 填写 这 个 新 分 配 空间 的 内 容 。value 域 仅 仅 给 调用 者 提供 值 。1ink 域 是 
指向 这 个 结 点 的 后 继 结 点 的 初始 化 指针 。 在 本 例 中 链表 为 空 ， 但 是 在 push 调用 时 依然 会 使 
用 Stack 对 象 中 的 list 域 。 因 此 ,语句 

cp->link = list; 


确保 了 这 个 结 点 出 现在 现 有 链表 的 头 部 。 如 下 图 所 示 : 


myStack.list 


myStack.count 
下 一 步 包括 更 新 Stack 对 象 的 list 域 ， 这 样 链 表 就 以 新 分 配 的 空间 开始 。 语 句 
list = cp; 

使 内 存 空 间 看 起 来 如 下 图 所 示 : 


cp 
value 


this 


myStack.list 


|myStack.count 
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从 那里 ，push 方法 增加 count 域 并 返回 至 主 程序 ， 这 导致 了 以 下 内 存 图 : 


myStack.list 





myStack.count 


pop 方法 刚好 和 这 个 过 程 相反 。 在 当前 状态 调用 myStack.pop O 创建 一 个 新 的 栈 帧 ， 
‘EA push 方法 对 应 的 栈 帧 基本 上 是 相同 的 ， 只 是 value 当前 是 一 个 局 部 变量 而 不 是 一 个 
ER: 


myStack.list 


myStack.count 





在 确保 栈 不 为 空 后 ，pop 方法 开始 的 两 条 赋值 语句 将 指向 栈 顶 的 指针 和 栈 顶 的 值 复制 给 
栈 帧 的 局 部 变量 ， 如 下 图 所 示 : 


myStack.list 





myStack.count 


由 于 pop 方法 必须 释放 结 点 所 占用 的 内 存 空间 ， 因 此 需要 局 部 变量 保存 结 点 的 值 ， 这 样 ， 
当 Stack 对 象 运行 时 ， 它 不 会 消耗 越 来 越 多 的 内 存 。 因 为 在 结 点 内 存 空 间 被 释放 后 再 查看 
其 中 的 内 容 是 不 合法 的 ， 故 弹出 值 必须 存储 在 局 部 变量 中 ， 这 样 方法 可 以 返回 它 。 

pop 实现 方法 的 核心 语句 是 : 


list = list-»link; 


它 使 用 当前 结 点 后 的 子 链表 代替 Stack 对 象 的 链表 ， 此 例 中 子 链 为 空 。 将 这 个 值 赋 给 栈 的 
list 部 分 ， 释 放空 间 ， 从 方法 中 返回 ， 从 而 得 到 以 下 的 最 终 状 态 ， 它 对 应 于 一 个 空 栈 : 


myStack.list 


E myStack.count 





14.3 ”队列 的 实现 


正如 你 从 第 5 章 中 所 了 解 到 的 ， 栈 和 队列 的 结构 非常 类 似 。 它 们 之 间 的 唯一 差别 是 元 素 
的 处 理 顺 序 不 同 。 栈 使 用 一 种 被 称 为 后 进 先 出 〈(LIFO) 的 原则 来 处 理 元 素 ， 即 最 后 人 栈 的 元 
素 总 是 第 一 个 出 栈 。 而 队列 采用 了 一 种 称 为 先进 先 出 ( FIFO) 的 模式 来 处 理 元 素 ， 即 它 更 像 
是 一 条 等 待 队列 。 栈 和 队列 的 接口 也 极为 相似 。 两 个 接口 的 公有 部 分 的 唯一 变化 是 定义 类 行 
为 的 两 个 方法 的 名 字 。 来 自 Stack 类 的 push 方法 现在 被 称 为 enqueue，pop 方法 被 称 为 
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dequeue。 这 些 方法 的 行为 也 是 不 同 的 ， 这 也 反映 在 图 14-6 所 示 的 queue.h 接口 的 注释 中 。 

鉴于 这 些 结构 和 它们 的 接口 概念 上 的 相似 性 ， 栈 和 队列 都 能 使 用 基于 数组 或 者 基于 链 
表 的 策略 来 实现 ， 我 们 对 此 不 应 感到 惊讶 。 然 而 ， 使 用 这 些 模型 时 ， 一 个 队列 的 实现 方法 有 
微妙 的 区 别 ， 它 们 并 不 出 现在 栈 的 实例 中 。 这 些 不 同 点 基于 这 样 一 个 事实 : 栈 中 的 所 有 操 
作 发 生 在 内 部 数据 结构 的 未 尾 。 在 一 个 队列 中 ，enqueue 操作 发 生 在 内 部 结构 的 末尾 ， 而 
dequeue 操作 则 发 生 在 另 一 端 。 


14.3.1 “基于 数组 的 队列 实现 


一 个 队列 的 行为 不 再 限制 于 数组 的 末尾， 根据 这 个 事实 ， 你 还 需要 两 个 参数 跟踪 队列 的 
头 部 和 末尾 。 因 此 ， 队 列 类 的 私有 的 实例 变量 如 下 所 示 : 

ValueType *array; 

int capacity; 

int head; 

int tail; 
在 上 述 表 示 中 ，head 域 拥 有 下 一 个 将 出 队 的 队列 中 头 元 素 的 索引 ， 而 tail 域 拥有 队列 末 
尾 元 素 的 索引 。 很 显然 ， 在 一 个 空 队列 中 tail 域 应 该 为 0， 它 表示 数组 的 初始 位 置 ， 但 是 
head 域 的 值 为 多 少 ? 为 了 方便 ,通常 的 策略 也 是 设置 head 域 的 值 也 为 0。 当 队列 采用 这 
种 方法 定义 时 ，head 和 tail 相等 ， 并 表示 队列 为 空 。 


/* 


* File: queue.h 
* 


* This interface exports a template version of the Queue class. 


ay 


#ifndef queue h 
#define queue h 


#include "error.h" 


* 
* Class: Queue<ValueType> 


* This class implements a queue of the specified value type. 


template «typename ValueType» 
class Queue { 


public: 


* Constructor: Queue 
* Usage: Queue<ValueType> queue; 
* 


* Initializes a new empty queue. 
x/ 
Queue () ; 
/* 
* Destructor: -Queue 
* Usage: (usually implicit) 
* 
* Frees any heap storage associated with this queue 
«if 


~Queue () ; 


* 
* Method: size 
* Usage: int n = queue.size(); 





图 14-6 关于 多 态 队 列 抽象 的 接口 
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* Returns the number of values in the queue. 
e 


int size() const; 


Method: isEmpty 
Usage: if (queue.isEmpty()) 


Returns true if the queue contains no elements. 
xy 
bool isEmpty() const; 


clear 
queue.clearí); 


Removes all elements from this queue 


void clear(); 


Method: enqueue 
Usage: queue.enqueue(value); 


Adds value to the end of the queue. 


void enqueue(ValueType value); 


Method: dequeue 
Usage: ValueType first = queue. dequeue |() 


Removes and returns the first item in the queue This method 
signals an error if called on àn empty queue 
/ 


ValueType dequeue(); 


ValueType first = queue.peek(); 
Returns the first value in the queue without removing it 


method signals an error if called on an empty queue. 


ValueType peek() const; 
/ * 


* Copy constructor and assignment operator 


* These methods implement deep copying for queues 


m/f 


Queue (const Queue«ValueType» & src); 
Queue<ValueType> & operator-(const Queue<ValueType> & src); 


The private section of the class goes here. 


The implementation of the class goes here. 


$endif 





图 14-6 (£X) 
如 果 你 使 用 这 种 表示 策略 ，Queue 的 构造 函数 如 下 图 所 示 : 


template <typename ValueType> 
Queue<ValueType>: :Queue() ( 
head = tail = 0; 
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enqueue 和 dequeue 方法 看 起 来 几乎 和 Stack 类 中 对 应 的 push All pop x e 
样 ， 尽 管 这 种 想法 十 分 诱 人 ， 但 如 果 你 尝试 复制 现存 的 代码 ， 将 会 遇 到 几 个 问题 。 在 你 实 
队列 之 前 ， 用 画图 的 方式 保证 你 能 够 完全 理解 队列 的 操作 往往 更 有 帮助 。 

为 了 理解 队列 的 这 种 表示 法 是 如 何 工 作 的 ， 想 象 一 下 队列 代表 一 条 等 待 队列 ， 它 和 第 5 
章 模拟 的 图 形 相 似 。 一 个 新 的 顾客 时 不 时 到 达 并 被 添加 到 队列 中 。 队 列 中 的 顾客 周期 性 地 在 
队列 的 头 部 接受 服务 ， 之 后 他 们 将 完全 离开 队列 。 队 列 的 数据 结构 是 如 何 响应 这 些 操 作 的 ? 

假设 刚 开 始 时 队列 为 空 ， 它 的 内 部 结构 看 起 来 如 下 图 所 示 : 





的 结构 图 形 : 





head 域 的 值 为 0， 表 示 队 列 中 的 第 一 个 顾客 被 存储 在 数组 的 位 置 0 处; tail 域 的 值 为 5， 
ink RES. SENHE, UN. Jos. BROS 
队列 开始 位 置 的 顾客 ， 然 后 将 一 个 新 的 顾客 添加 到 队 尾 。 例 如 ， 顾 客 A 出 列 ， 顾 客 F 到 达 ， 
这 得 到 了 下 面 的 情形 : 





想象 一 下 ， 在 下 一 个 顾客 到 来 之 前 ， 你 每 次 服务 一 位 顾客 ,这 种 趋势 一 直 持 续 到 顾客 本 到 
达 。 然 后 ， 队 列 的 内 部 结构 看 起 来 如 下 图 所 示 : 





此 时 ， 你 遇 到 一 点 问题 。 队 列 中 只 有 五 个 顾客 ， 但 你 已 经 用 完了 所 有 可 用 的 空间 。 
tail 域 正 指向 超出 数组 未 尾 的 位 置 。 另 一 方面 ， 在 数组 的 头 部 尚 有 未 使 用 的 空间 。 因 此 ， 
不 增加 tail， 因 为 它 表示 不 存在 的 位 置 10， 取 而 代 之 的 是 ， 你 可 以 从 数组 的 尾部 绕 回 到 位 
置 0 处， 如 下 图 所 示 : 
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从 这 个 位 置 开 始 ， 你 有 了 可 使 用 的 空间 ， 顾 客 K 入 列 ， 并 存储 在 数组 位 置 0 处 ， 这 得 
到 了 下 面 的 图 结构 : 





如 果 你 允许 队列 中 的 元 素 从 数组 的 尾部 绕 回 到 头 部 ， 活 跃 的 元 素 总 是 从 head 索引 处 一 直 延 
续 到 tail 索引 前 面 的 位 置 ， 如 下 图 所 示 : 





因为 数组 的 尾部 和 头 部 表现 得 好 像 被 连接 在 一 起 ， 因 此 ， 程 序 员 称 这 种 表示 法 为 环形 缓冲 区 
(ring buffer) 。 

在 你 编写 enqueue 和 dequeue 的 代码 之 前 ， 剩 下 唯一 需要 考虑 的 问题 是 如 何 检测 一 
个 队列 是 否 满 了 。 队 列 为 满 的 情况 检测 可 能 比 你 预期 的 要 更 加 复杂 。 为 了 理解 哪些 地 方 会 
产生 复杂 问题 ， 假 设 在 其 他 额外 的 顾客 被 服务 之 前 ， 有 三 个 以 上 的 顾客 到 达 。 如 果 你 将 顾客 
L、M 和 N 入 队 ， 数 据 结 构 看 起 来 如 下 图 所 示 : 
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此 时 ， 上 图 中 好 像 上 只 有 一 个 额外 的 空间 。 如 果 此 时 顾客 O 到 达 ， 将 会 发 生 什么 ”如 果 你 遵 
循 前 面 入 队 操 作 的 逻辑 ， 最 终 的 结果 将 具有 如 下 结构 : 





head 0 1 2 5 4 H 6 7 x y 


队列 数组 现在 是 完全 满 的 。 遗 憾 的 是 ， 无 论 何 时 ，head 和 tail 域 都 有 相同 的 值 ， 正 如 上 
图 所 示 ， 因 此 队列 被 认为 是 空 的 。 没 有 办 法 能 够 区 分 队列 结构 本 身 是 空 还 是 满 ， 因 为 在 两 种 
EF, head 和 tail 域 值 看 起 来 一 样 。 尽 管 你 可 以 通过 为 空 队列 采用 一 个 不 同 的 定义 并 
写 一 些 特殊 情况 的 代码 来 解决 这 个 问题 ， 最 简单 的 方法 是 限制 队列 元 素 的 个 数 比 队列 的 容量 
小 1， 并 且 在 达到 限制 条 件 时 ， 扩 充 数组 。 

Queue 类 模板 的 环形 缓冲 区 的 实现 代码 显示 在 图 14-7 和 图 14-8 中 。 一 个 重要 的 观察 
结果 是 : 代码 并 不 能 明确 检测 数组 索引 以 观察 元 素 是 否 从 数组 尾部 绕 回 到 数组 头 部 。 取 而 
代 之 的 是 ， 代 码 能 够 利用 % 操作 符 自动 计算 正确 的 索引 位 置 。 通 过 求 一 个 结果 的 余数 ， 使 
其 结果 值 落 在 一 个 整数 循环 范围 内 的 技术 是 一 个 重要 的 数学 方法 ， 被 称 为 模 运 算 ( modular 

arithmetic ) 。 
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Private section */ 


Implementation notes 


* 


The array-based queue stores the elements in successive index 
positions in an array, just as a stack does What makes the 
queue structure more complex is the need to avoid shifting 
elements as the queue expands and contracts In the array 
model, this goal is achieved by keeping track of both the 
head and tail indices. The tail index increases by one each 
time an element is enqueued, and the head index increases by 
one each time an element is dequeued, Each index therefore 
marches toward the end of the allocated array and will 
eventually reach the end Rather than allocate new memory, 
this implementation lets each index wrap around back to the 
beginning as if the ends of the array of elements were joined 
to form a circle. This representation is called a ring buffer. 


s Ww eo *& * *  » * » 


The elements of the queue are stored in a dynamic array of 

the specified element type. If the space in the array is ever 
exhausted, the implementation doubles the array capacity 

Note that the queue capacity is reached when there is still 
one unused element in the array If the queue is allowed to 
fill completely, the head and tail indices have the same 
value, and:the queue appears empty 


* 
* 
* 
* 
* 
* 
* 


private: 
static const int INITIAL CAPACITY - 10; 
/* Instance variables */ 


ValueType *array; A dynamic array of the elements 
int capacity; The allocated size of the array 
int head; The index of the head element 
int tail; The index of the tail element 


Private method prototypes */ 


void deepCopy(const Queue«ValueType» & src); 
void expandCapacity(); 





图 14-7. 基于 数组 的 队列 的 私有 部 分 


/* 
* Implementation section 


* Clients should not need to look at any of the code beyond this point. 
ay 


/* 


* Implementation notes: Queue constructor 


* The constructor allocates the array storage and initializes the fields. 
i d 


template «typename ValueType> 

Queue«ValueType»::Queue() ( 
capacity = INITIAL CAPACITY; 
array = new ValueType [capacity]; 
head - 0; 
tail = 0; 

} 


/* 


* Implementation notes: ~Queue 


* The destructor frees any memory that is allocated by the implementation. 
#7 





Al 14-8 基于 数组 的 队列 的 实现 
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template <typename ValueType> 

Queue<ValueType>: :~Queue() { 
delete[] array; 

} 


/* 
* Implementation notes: 


* The size is calculated from head and tail using modular arithmetic 


af 


template <typename ValueType> 
int Queue«ValueType»::size() const { 

return (tail + capacity - head) % capacity; 
} 


Implementation notes: isEmpty 


The queue is empty whenever the head and tail pointers are equal This 
interpretation means that the queue must always leave one unused space 


ay 


template <typename ValueType> 
bool Queue«ValueType»::isEmpty() const ( 
return head -- tail; 


} 
/* 
* Implementation notes: clear 
* 
* The clear method need not take account of where in the ring buffer the 
existing values are stored and can simply reset the head and tail indices. 


ba f 


template <typename ValueType> 

void Queue«ValueType»::clear() { 
head - tail - 0; 

) 


Implementation notes: enqueue 


This method first checks to see whether there is enough room for the 
element and then expands the array storage if necessary. Because it 
is otherwise impossible to differentiate the case when a queue is 
empty from when it is completely full, this implementation expands 
the queue when the size is one less than the capacity. 


template «typename ValueType» 

void Queue«ValueType»::enqueue(ValueType value) { 
if (size() == capacity - 1) expandCapacity(); 
array[tail] = value; 
tail = (tail + 1) * capacity; 


These methods check for an empty queue and report an error if 
there is no first element. 


template «typename ValueType» 
ValueType Queue«ValueType»::dequeue() { 
if (isEmpty()) error("dequeue: Attempting to dequeue an empty queue"); 
ValueType result - array[head]; 
head = (head + 1) % capacity; 
return result; 


) 


template «typename ValueType> 

ValueType Queue«ValueType»::peek() const { 
if (isEmpty()) error("peek: Attempting to peek at an empty queue"); 
return array[head]; 





图 14-8 (£X) 
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Implementation notes: Deep copying support 


These methods implement deep copying for queues. 


/ 


template «typename ValueType» 

Queue«ValueType»::Queue(const Queue<ValueType> & src) ( 
deepCopy (src); 

) 


template «typename ValueType> 
Queue«ValueType» & Queue«ValueType»::operator-(const Queue«ValueType» & src) ( 
if (this != &src) { 
delete[] array; 
deepCopy (src); 


return *this; 


} 


template «typename ValueType» 
void Queue«ValueType»::deepCopy(const Queue«ValueType» & src) ( 
int count - src.size(); 
capacity = count + INITIAL CAPACITY; 
array = new ValueType[capacity]; 
for (int i = 0; i < count; i++) { 
array[i] = src.array[(src.head + i) * src.capacity]; 


head = 0; 
tail - count; 


Implementation notes: expandCapacity 

This private method doubles the capacity of the dynamic array whenever 
it runs out of space For simplicity, this implementation also shifts 
all the elements back to the beginning of the array. 


template «typename ValueType» 

void Queue«ValueType»::expandCapacity() { 
int count - size(); 
ValueType *oldArray - array; 
array - new ValueType[2 * capacity]; 
for (int i = 0; i « count; i**) ( 

array[i] = oldArray[ (head + i) % capacity]; 

) 
capacity *- 2; 
head - 0; 
tail - count; 
delete[] oldArray; 





图 14-8 ( 续 ) 


14.3.2 ”队列 的 链表 表示 


队列 queue 类 也 有 一 个 简单 地 使 用 链表 结构 的 表示 方法 。 如 果 你 采用 这 种 方法 ， 队 列 
中 的 元 素 将 被 存储 在 一 个 链表 中 ， 链 表 以 队 头 开始 并 在 队 尾 结束 。 为 了 人 允许 enqueue 和 
dequeue 操作 能 在 一 个 常量 时 间 里 运行 , Queue 对 象 必须 拥有 一 个 指向 队 尾 的 指针 。 因 此 ， 
私有 的 实例 变量 被 定义 成 如 图 14-9 私有 部 分 的 修订 版 所 示 一 样 。 在 注释 中 ， 相 比 周 围 的 文 
F, ASCI 数据 图 可 能 给 实现 者 传递 了 更 多 的 信息 。 有 时 候 产 生 这 样 的 图 是 单调 乏味 的 ， 但 
是 它们 给 读者 提供 了 大 量 的 信息 。 

给 出 一 个 现代 的 文字 处 理 器 和 一 个 绘图 程序 ， 相 比 于 你 单独 使 用 ASCII 字符 ， 可 能 会 
产生 更 多 的 细节 图 形 。 如 果 你 正在 为 一 个 大 而 复杂 的 系统 设计 数据 结构 ， 创 建 这 些 图 并 将 它 
们 作为 一 个 程序 包 的 扩展 文件 的 一 部 分 ， 理 想 地 是 包含 在 一 个 网 页 中 。 例 如 ， 这 里 是 包含 顾 
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ZA, BAC 的 队列 的 一 个 可 读 性 更 高 的 图 : 


Private section */ 


w 
* 


* 


Implementation notes: Queue data structure 


* 


The list-based queue uses a linked list to store the elements 

of the queue To ensure that adding a new element to the tail 

of the queue is fast, the data structure maintains a pointer to 
the last cell in the queue as well as the first If the queue is 
empty, both the head pointer and the tail pointer are set to NULL 


The following diagram illustrates the structure of a queue 
containing two elements, A and B. 


* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 


private: 
/* Type for linked list cell */ 


struct Cell ( 

ValueType data; The data value 

Cell *link; Link to the next cell 
}; 


Instance variables */ 


Cell *head; Pointer to the cell at the head 
Cell *tail; Pointer to the cell at the tail 
int count; Number of elements in the queue 


Private method prototypes */ 


void deepCopy (const Queue<ValueType> & src); 





图 14-9 基于 链表 的 队列 的 私有 部 分 
关于 基于 链表 的 队列 实现 的 代码 显示 在 图 14-10 中 。 总 的 来 说 ， 这 个 代码 是 相当 简单 


. 的 ， 尤 其 是 如 果 你 使 用 栈 的 链表 实现 方法 作为 模板 。 内 部 的 结构 图 提供 了 你 所 需 的 重要 视 


角 ， 它 可 以 帮助 你 理解 如 何 实现 这 些 队列 操作 。 例 如 ，enaqueue 操作 在 tail 指针 标记 的 
地 方 添加 一 个 新 的 空间 ， 然 后 更 新 tail 指针 使 它 继续 表示 链表 的 结尾 。dequeue 操作 包 
括 head 指针 标记 的 空间 ， 并 返回 该 空间 处 的 值 。 

实现 方法 中 唯一 复杂 的 地 方 是 空 队列 的 表示 。 表 示 一 个 空 队列 的 最 简单 的 方法 是 在 
head 指针 处 存储 NULL， 如 下 图 所 示 : 
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ementation section 


‘b+ requires that the implementation for a template class be available 
compiler whenever that type is used The effect of this 
ti is that header files must include the implementation. 
wuld not need to look at any of the code beyond this point 


Implementation notes: Queue constructor 
F Z 


reates an empty linked list and sets the count to 0. 


template <typename ValueType> 
Queue«ValueType»::Queue() { 
head = tail = NULL; 
count = 0; 


~Queue destructor 


any heap memory allocated by the queue, 


template <typename ValueType> 
Queue<ValueType>: :~Queue() { 
clear (); 


Implementation notes: size, isEmpty, clear 


These methods use the count variable and therefore run in constant time. 


template «typename ValueType» 
int Queue«ValueType»::size() const ( 
return count; 


) 


template «typename ValueType» 
bool Queue«ValueType»::isEmpty() const { 
return count -- 0; 


) 


template «typename ValueType» 
void Queue«ValueType»::clear() ( 
while (count » O) ( 
dequeue () ; 
) 


Implementation notes: enqueue 
This method allocates a new list cell and chains it in at the tail of 
the queue. If the queue is currently empty, the new cell also becomes 
the head pointer in the queue. 

*j 


template «typename ValueType> 
void Queue«ValueType»::enqueue(ValueType value) { 
Cell *cp - new Cell; 
cp-»data = value; 
cp-»link - NULL; 
if (head -- NULL) [ 
head - cp; 
) eise ( 
tail-»link - cp; 
) 
tail - cp; 
count++; 





图 14-10 ”基于 链表 的 队列 的 实现 
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Implementation notes: dequeue, 


These methods check for an empty queue and report an error if 
there is no first element The dequeue method also checks for 
the case in which the queue becomes empty and sets both the head 
and tail pointers to NULL. 

/ 


template «typename ValueType» 
ValueType Queue«ValueType»::dequeue() ( 
if (isEmpty()) error("dequeue: Attempting to dequeue an empty queue"); 
Cell *cp = head; 
ValueType result - cp-»data; 
head = cp-»link; 
if (head == NULL) tail = NULL; 
delete cp; 
count--; 
return result; 


) 


template «typename ValueType» 

ValueType Queue«ValueType»::peek() const { 
if (isEmpty()) error("peek: Attempting to peek at an empty queue"); 
return head-»data; 

} 


/* 


* Implementation notes: copy constructor and assignment operator 


i: * These methods follow the standard template, leaving the work to deepCopy. 
bii 


template «typename ValueType> 

Queue<ValueType>: :Queue (const Queue<ValueType> & src) { 
deepCopy (src) ; 

} 


template <typename ValueType> 
Queue<ValueType> & Queue<ValueType>: :operator=(const Queue«ValueType» & src) ( 
if (this != &src) { 
clear(); 
deepCopy (src) ; 


) 


return *this; 


Implementation notes: deepCopy 


This function copies the data from the src parameter into the current 
object. This implementation simply walks down the linked list in the 
source object and enqueues each value in the destination 


template «typename ValueType> 
void Queue«ValueType»::deepCopy(const Queue<ValueType> & src) ( 
head - NULL; 
tail - NULL; 
count - 0; 
for (Cell *cp = src.head; cp != NULL; cp = cp->link) ( 
enqueue (cp-»data) ; 


) 





图 14-10 ( 续 ) 


enqueue 的 实现 代码 必须 将 空 队 列 作 为 一 个 特殊 情况 进行 检测 。 如 果 head 指针 为 

NULL, enqueue 必须 设置 nead 和 tail 指针 的 值 ， 使 得 它们 指向 包含 新 元 素 的 空间 。 因 

x 此 ， 如 果 你 想 要 将 顾客 A 放 人 一 个 空 队列 中 ,在 enqueue 操作 的 最 后 ， 指 针 的 内 部 结构 将 
648| 看 起 来 如 下 图 所 示 : 
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如 果 再 次 调用 enqueue, head 指针 将 不 再 为 NULL ， 这 意味 着 实现 的 代码 不 再 需要 执 

行 关于 空 队 列 的 特殊 情况 的 动作 。 取 而 代 之 的 是 ，enqueue 实现 方法 使 用 tail 指针 找到 

链表 的 结尾 ， 并 在 该 处 添加 新 的 空间 。 例 如 ， 如 果 你 在 顾客 A 之 后 将 顾客 BAR, 该 队列 
的 最 终结 构 看 起 来 如 下 图 所 示 : 

head 

tail 


count 





144 ”实现 矢量 类 


第 5 ENAR Vector 类 是 线性 结构 的 男 一 个 例子 。 在 很 多 方面 ，Vector 类 的 实现 方 
法 是 第 13 章 的 编辑 器 缓冲 区 和 本 章 中 你 所 见 过 的 栈 和 队列 抽象 的 结合 。Vector RAUF 
EditorBuffer 类 ， 它 允许 用 户 插 入 或 删除 任何 位 置 上 的 元 素 。 同 时 ，vVector 也 类 似 于 
Stack 和 Queue 类 ， 因 为 它 实 现 了 深 拷贝 ， 并 且 使 用 模板 来 支持 多 态 。 

由 于 你 见 过 和 Vector 类 似 的 类 ， 所 以 代码 需要 解释 的 方面 更 少 。 在 前 面 模型 中 的 
Vector 类 唯一 没有 出 现 的 方法 是 用 于 选择 的 方 插 号 。 正 如 你 从 前 面 几 章 所 了 解 到 的 ，C++ 
可 以 扩展 基本 运算 ， 使 它们 可 以 应 用 到 新 的 数据 类 型 中 。 使 用 大 致 相同 的 方式 ， 通 过 重 载 
operator[] 的 定义 ，C++ 允许 类 重新 定义 选择 的 方法 ， 重 载 operator [] 方法 的 函数 原 
型 如 下 所 示 : 


ValueType & operator[] (int index); 


与 插入 操作 符 一 样 ， 选 择 操 作 符 必须 通过 引用 返回 值 ， 以 便 它 可 以 将 一 个 新 值 赋 给 一 个 元 素 
位 置 。 
多 态 的 vector .h 接口 的 完整 文本 描述 包括 其 私有 部 分 和 实现 部 分 ， 如 图 14-11 所 示 。 


/* 


* File: vector.h 
* 


* This interface exports the Vector template class, which provides an 
* efficient, safe, convenient replacement for the array type in C++. 
Wy 

#ifndef vector h 

#define vector h 

#include "error.h" 


/* 
Class: Vector<ValueType> 


* 
* 


* This class stores an ordered list of values similar to an array. It 
* supports traditional array selection using square brackets, but also 
* supports the insertion and deletion of elements. 


*/ 





图 14-11 vector.h 接口 
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template «typename ValueType» 
class Vector { 


public: 
/* 


* Constructor: Vector 
* Usage: Vector«ValueType» vec; 
Vector«ValueType» vec(n, value); 


Initializes a new Vector object. The first form creates an empty vector; 
the second creates a vector of size n in which each element is initialized 
to the specified value or the default value for the element type. 


Vector(); 
Vector (int n, ValueType value = ValueType()); 


/* 
* Destructor: -Vector 
* Usage: (usually implicit) 


* Frees any heap storage allocated by this vector. 
a] 
~Vector (); 


Method: size 
Usage: int n vec.size(); 


Returns the number of values in this vector. 


*f 


int size() const; 


Method: isEmpty 
Usage: if (vec.isEmpty()) 


Returns true if this vector contains no elements. 


wf 


bool isEmpty() const; 


* Method: clear 
Usage: vec.clear():; 


Removes all elements from this vector. 


ef 
void clear(); 


/* 

* Method: get 

* Usage: ValueType value - vec.get(index); 

* 

* Returns the element at the specified index in this vector. This method 
* signals an error if the index is not in the array range. 


y 
ValueType get(int index) const; 
* Method: set 
* Usage: vec.set (index, value); 
* Replaces the element at the specified index in this vector with a new 


* value. The previous value at that index is overwritten. This method 
signals an error if the index is not in the array range. 


* 
«7 


void set(int index, ValueType value); 
/* 


* Method: insert 





图 14-11 (4) 
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the element into this vector before the specified index All 
elements are shifted one position to the right This method 
an error if the index is outside the range from 0 up to and 
:cluding the length of the vector. 


void insert (int index, ValueType value); 


Method: remove 
Usage: vec.remove (index) ; 


* Removes the element at the specified index from this vector. All 


* 


/* 


* 


* 
* 


subsequent elements are shifted one position to the left. This method 
signals an error if the index is outside the array range. 


void remove(int index); 


Method: add 
Usage: vec.add(value); 


Adds a new value to the end of this vector. 


/ 


void add(ValueType value); 


Operator: [] 

Usage: vec[index] 

Overloads [] to select elements from this vector. This extension 
enables the use of traditional array notation to get or set individual 
elements. This method signals an error if the index is outside the 
array range. 


/ 


ValueType & operator[](int index); 


Copy constructor and assignment operator 


These methods implement deep copying for vectors. 
/ 


Vector(const Vector«ValueType» & src); 
Vector«ValueType» & operator-(const Vector«ValueType» & src); 


Private section */ 


Notes on the representation 


This version of the vector.h interface stores the elements in a 
dynamic array of the specified element type. If the space in the 
array is ever exhausted, the implementation doubles the array capacity. 


my: 


private: 


/* 


static const int INITIAL CAPACITY = 10; 


Instance variables */ 


ValueType *array; /+ A dynamic array of the elements */ 
int capacity; /* The allocated size of the array */ 


int count; /* The number of elements in use 


Private method prototypes */ 


void deepCopy (const Vector<ValueType> & src); 
void expandCapacity(); 


图 14-11 (£4) 
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Implementation notes: Vector constructor and destructor 


The two implementations of the constructor each allocate storage for 
the dynamic array and then initialize the other fields of the object. 


The destructor frees the heap memory used by the dynamic array. 
wh 


template <typename ValueType> 
Vector<ValueType>::Vector() { 
capacity = INITIAL CAPACITY; 
count = 0; 
array = new ValueType[capacity]; 


) 


template «typename ValueType» 

Vector«ValueType»::Vector(int n, ValueType value) ( 
capacity - (n » INITIAL CAPACITY) ? n : INITIAL CAPACITY; 
array - new ValueType[capacity]; 
count - n; 
for (int i = 0; i < n; i++) { 

array[i] = value; 
) 
) 


template «typename ValueType» 

Vector<ValueType>::~Vector() { 
delete[] array; 

} 


/* 


* Implementation notes: size, 


* These methods require only the count field and do not look at the data 


wy 


template <typename ValueType> 
int Vector<ValueType>::size() const { 


return count; 


) 


template «typename ValueType» 
bool Vector«ValueType»::isEmpty() const { 
return count -- 0; 


) 


template «typename ValueType» 
void Vector<ValueType>::clear() ( 
count = 0; 


) 


Implementation notes: get, 


These methods first check that the index is in range and then get or set 
the appropriate index position in the dynamic array. 


template <typename ValueType> 

ValueType Vector<ValueType>::get (int index) const { 
if (index < 0 || index >= count) error("get: index out of range"); 
return array [index]; 


) 


template «typename ValueType» 

void Vector«ValueType»::set(int index, ValueType value) ( 
if (index < 0 || index >= count) error("set: index out of range"); 
array[index] - value; 


Implementation notes: Vector selection 
The following code implements traditional array selection using square 


brackets for the index To ensure that clients can assign to array 
elements, this method uses an & to return the result by reference 


图 14-11 (2%) 
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template <typename ValueType> 

ValueType & Vector<ValueType>: :operator[] (int index) { 
if (index < 0 || index >= count) error("Vector index out of range"); 
return array[index]; 


Implementation notes: add, insert, remove 


These methods shifts the existing elements in the array to make room 
for a new element or to close up the space left by a deleted one. 
wj 


template «typename ValueType» 
void Vector«ValueType»::add(ValueType value) { 
insert(count, value); 


) 


template «typename ValueType» 
void Vector«ValueType»::insert(int index, ValueType value) ( 
if (count == capacity) expandCapacity () ; 
if (index < 0 || index > count) error("insert: index out of range"); 
for (int i = count; i > index; i--) { 
array[i] = array[i - 1]; 
} 
array[index] = value; 
count++; 


} 


template <typename ValueType> 
void Vector«ValueType»::remove(int index) { 
if (index < 0 || index >= count) error("remove: index out of range"); 
for (int i = index; i < count - 1; i++) ( 
array[i] = array[i + 1]; 
) 
count--; 


) 
/* 


* Implementation notes: copy constructor and assignment operator 


* These methods follow the standard template, leaving the work to deepCopy. 
*/ 


template «typename ValueType» 

Vector«ValueType»::Vector(const Vector«ValueType» & src) ( 
deepCopy (src); 

) 


template «typename ValueType» 
Vector«ValueType» & Vector«ValueType»::operator-(const Vector<ValueType> & src) 
if (this !- &src) ( 
delete[] array; 
deepCopy (src); 
) 


return *this; 


Implementation notes: deepCopy 


This function copies the data from the src parameter into the current 
object. All dynamic memory is reallocated to create a "deep copy" in 
which the current object and the source object are independent. 
The capacity is set so that the vector has some room to expand. 


template «typename ValueType» 
void Vector«ValueType»::deepCopy(const Vector<ValueType> & src) { 
capacity = src.count + INITIAL CAPACITY; 
this-»array = new ValueType [capacity]; 
for (int i ; i < src.count; i++) { 
array[i] src.array[i]; 


) 


count - src.count; 


图 14-11 (4£) 
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) 
/* 


* Implementation notes: expandCapacity 
* 


* This method doubles the array capacity whenever it runs out of space 
«f 


template «typename ValueType» 
void Vector«ValueType»::expandCapacity() ( 
ValueType *oldArray - array; 
capacity *- 2; 
array - new ValueType[capacity]; 
for (int i - 0; i < count; i++) ( 
array[i] = oldArray[i]; 


delete[] oldArray; 
) 


fendif 





图 14-11. (48) 


14.5 ”集成 原型 和 代码 


使 用 接口 的 一 个 主要 原因 是 向 用 户 隐藏 实现 的 复杂 性 。 对 于 第 2 章 你 所 见 到 的 排序 的 简 
单 接口 ， 接 口 和 实现 的 界限 是 通过 将 它们 放 在 单独 的 文件 中 实现 的 。 用 户 所 需要 看 的 是 定义 
接口 的 .h 文件 ， 实 现 的 繁琐 细节 被 归 和 人 到 相应 的 .cpp 文件 中 。 

遗憾 的 是 ， 当 接口 变 得 更 加 复杂 ，C++ 就 很 难 维持 那样 的 分 离 级 别 。 一 个 类 的 私有 部 分 
必须 被 包含 在 类 定义 中 ， 这 个 要 求 意味 着 这 些 细节 地 方 必须 是 .h 文件 的 一 部 分 。 对 于 模板 类 
而 言 ， 相 关 情 况 更 加 槽 糕 ， 因 为 C++ 要 求 无 论 何 时 模板 类 想 要 扩展 一 个 模板 ， 它 完整 的 实现 
必须 可 用 。 这 种 约束 的 作用 是 使 模板 类 的 接口 和 定义 一 样 ， 必 须 包含 所 有 的 代码 。 

假设 一 个 模板 类 的 实现 无 论 如 何 都 将 是 .h 文件 的 一 部 分 ， 一 些 专业 的 C++ FEF 
放弃 了 物理 分 离 的 概念 ， 并 直接 在 类 中 包含 方法 的 主体 。 采 用 这 种 策略 能 够 显著 简化 类 的 语 
法 结构 。template 关键 字 只 在 类 的 开头 出 现 一 次 ， 并 且 不 需要 在 每 一 个 方法 的 实现 代码 中 
重复 它 。 每 一 个 方法 的 实现 都 在 类 内 ， 这 个 事实 意味 着 你 可 以 省 略 ; : 这 个 标签 。 

然而 ， 尽 管 就 语法 的 简化 而 言 ， 它 存在 优势 ， 但 本 书 中 的 例子 仍 继续 把 方法 原型 和 实现 
代码 放 在 .h 文件 的 不 同 部 分 。 类 的 公有 部 分 只 包含 原型 。 相 应 的 实现 代码 出 现在 文件 的 末 
尾 ， 在 一 个 注释 后 提醒 用 户 除 了 .h 文件 中 的 其 他 东西 都 是 为 了 实现 。 至 少 维持 一 些 分 离 意 
RE: 对 于 用 户 而 言 ， 他 们 仍 可 以 看 到 整理 好 的 实现 细节 的 部 分 接口 文件 。 更 重要 的 是 ， 同 
时 在 .h 文件 的 不 同 部 分 包含 原型 和 实现 意味 着 和 完整 定义 联系 的 每 一 部 分 的 注释 都 能 有 相 
应 的 受众 。 在 .h 文件 开头 书写 的 原型 是 为 了 用 户 ， 并 且 它 不 包含 任何 的 实现 细节 。 相 比 之 
下 ， 和 实际 代码 相关 的 注释 是 为 实现 者 准备 的 。 将 这 两 个 部 分 放 在 一 起 迫使 注释 面向 两 类 受 
众 ， 这 使 得 它们 对 于 用 户 而 言 作用 更 小 。 


本 章 小 结 


FEAR, 你 已 经 学 会 了 如 何 将 C++ 的 模板 机 制 用 于 一 般 的 容器 类 中 。 就 一 个 专门 用 于 
特殊 用 户 数据 类 型 的 占 位 符 而 言 ， 模 板 允 许 你 定义 类 。 你 也 有 机 会 观察 Stack 和 Queue 
类 ， 以 及 多 态 的 vector 类 的 公共 接口 ， 这 些 基 于 数组 和 基于 链表 的 实现 方法 。 

本 章 的 重点 包括 : 
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© 除了 较 传 统 的 基于 数组 的 表示 方法 ,我 们 还 可 以 使 用 链表 结构 实现 栈 。 

e 基于 数组 的 队列 实现 在 某 些 地 方 比 基于 栈 的 实现 更 为 复杂 。 传 统 的 实现 方法 使 用 一 
个 被 称 为 环形 缓存 区 的 结构 ， 其 中 ， 元 素 逻 辑 性 地 从 数组 结尾 绕 回 到 开头 。 模 运算 
容易 实现 环形 缓存 区 的 概念 。 

e 在 本 章 使 用 的 环形 缓存 区 的 实现 方法 中 ， 当 一 个 队列 的 头 和 尾 索 引 值 相同 时 ， 它 被 
认为 是 空 的 。 这 种 表示 策略 意味 着 队列 的 最 大 容量 比 数组 分 配 的 空间 少 一 个 。 尝 试 
将 所 有 的 元 素 都 填 人 数组 使 得 一 个 满 队 列 和 一 个 空 队列 几乎 难以 区 分 。 

e 也 可 以 使 用 两 个 指针 标记 的 链表 来 表示 队列 ， 一 个 指向 队列 涉 部 ， 男 一 个 指向 队列 
尾部 。 

e 使 用 动态 数组 很 容易 表示 Vector 类 。 插 入 和 删除 元 素 要 求 在 数组 中 移动 元 素 ， 这 
意味 着 这 些 操 作 通 常 需 要 O (N) 时 间 。 

e 你 可 以 通过 定义 方法 来 重新 定义 类 的 操作 ,方法 名 包含 关键 字 operator, 后面 接 
操作 符 符 号 。 净 其 是 你 可 以 通过 定义 operator[] 方法 来 重新 定义 选择 操作 。 


复习 题 
1. C++ 模板 能 给 通用 容器 的 设计 者 提供 什么 优势 ? 
2. 作为 用 户 ， 当 你 实例 化 一 个 类 模板 时 ， 如 何 确定 什么 类 型 将 被 用 于 填 人 模板 的 占 位 符 位 置 中 ? 
3. 使 用 链表 的 实现 方法 ,在 下 面 的 操作 执行 完成 后 ， 画 一 个 表示 myStack 类 对 在 执行 完 下 述 操作 后 
的 栈 元 素 图 : 
Stack«char» myStack; 
myStack.push('A'); 
myStack.push('B'); 
myStack.push('C'); 
4. 如 果 你 使 用 一 个 数组 来 存储 一 个 队列 潜在 的 元 素 ，Queue 类 需要 哪些 私有 的 实例 变量 ? 
5. 什么 是 一 个 环形 缓存 区 ? 环形 缓存 区 的 概念 是 如 何 应 用 到 队列 中 的 ? 658 
6. 你 怎样 识别 一 个 基于 数组 的 队列 是 否 为 空 ? 你 怎样 识别 元 素 个 数 是 否 到 达 它 的 最 大 容量 ? 
7. 假设 INITIAL CAPACITY 有 人 为 的 小 的 数值 3， 在 下 面 的 操作 序列 执行 完 后 ， 画 图 表示 基于 数组 
的 队列 myoueue: 
Queue<char> myQueue; 
myQueue.enqueue('A'); 
myQueue.enqueue('B'); 
myQueue.enqueue('C'); 
myQueue . dequeue () ; 
myQueue . dequeue () ; 
myQueue.enqueue('D'); 
myQueue.enqueue('E'); 
myQueue. dequeue () ; 
myQueue. enqueue ('F') ; 


8. 解释 一 下 模 运算 在 基于 数组 的 队列 实现 中 是 如 何 起 作用 的 。 
9. 描述 一 下 ， 关 于 基于 数组 的 队列 实现 ， 下 面 的 size 实现 代码 有 哪些 错误 ? 
template «typename ValueType» 
int Queue<ValueType>::size() const { 
return (tail - head) $ capacity; 
} 
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10. 在 计算 机 完成 了 复习 题 7 中 的 一 组 操作 后 ， 画 图 表示 一 个 链表 队列 的 内 部 结构 。 
11. 你 如 何 识别 一 个 链表 队列 是 否 为 空 ? 
12. 你 需要 哪些 重 载 方法 来 重新 定义 一 个 类 的 选择 [] 运算 ? 


习题 
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标准 的 C++ 3: X fF <algorithm>( 你 将 会 在 第 20 章 学 到 更 多 内 容 ) 包含 一 个 模板 函数 swap(x, y). 
函数 交换 了 x 和 y 的 值 。 编 写 并 测试 你 自己 的 swap 函数 的 实现 代码 。 

编写 一 个 sort.h 接口 ， 该 接口 提供 了 一 个 sort 函数 的 多 态 版 本 ，sort 函数 适用 于 实现 了 标准 
关系 运算 的 任何 基 类 型 。 你 的 函数 应 该 具有 以 下 原型 : 


template «typename ValueType» 
void sort(Vector<ValueType> & vec); 


使 用 图 10-9 出 现 的 快速 排序 算法 实现 sort 函数 。 


.设计 并 实现 一 个 模板 类 Pair<T1,T2>， 它 表示 一 对 值 ， 第 一 个 类 型 为 T1， 第 二 个 类 型 为 T2. 


Pair 类 应 该 提供 以 下 方法 : 

© 一 个 默认 的 构造 函数 ， 它 产生 一 对 默认 类 型 T1 和 T2 的 值 。 

© 一 个 构造 函数 Pair (v1,v2) ， 它 有 两 个 明确 的 类 型 值 。 

e 获取 first 和 second 方 法 ， 它 们 返回 所 存储 的 这 一 对 值 的 值 拷贝 。 


.开发 一 个 关于 stack.h 接口 的 相当 全 面 的 单元 测试 ， 使 用 几 种 不 同 基本 类 型 的 栈 来 测试 Stack 类 


提供 的 操作 。 使 用 你 的 单元 测试 程序 来 证 明 Stack 类 基于 数组 和 基于 链表 这 两 种 实现 方法 。 


. H queue .h 接口 设计 一 个 类 似 的 单元 测试 。 
. 因为 队列 的 环形 缓冲 区 实现 方法 使 得 我 们 可 以 辨别 一 个 空 对 列 和 一 个 满 队列 之 间 的 不 同 ， 所 以 当 动 


态 数 组 中 还 有 一 个 未 使 用 的 空间 时 ， 所 实现 的 方法 就 必须 为 其 增加 容量 。 通 过 改变 队列 的 内 部 表 
示 ， 你 可 以 避免 这 种 限制 ， 这 样 队列 的 固定 结构 就 可 跟踪 队列 的 元 素 个 数 ， 而 不 是 队 尾 元 素 的 索 
引 。 给 出 队 头 元 素 的 索引 和 队列 中 元 素 的 个 数 ， 你 很 容易 就 能 算出 队 尾 元 素 索引 ,这 意味 着 你 不 需 
要 明确 存储 这 个 值 。 重 写 基 于 数组 的 队列 的 表示 方法 ， 使 得 它 可 以 使 用 这 种 表示 方法 。 


.在 第 5 章 的 习题 13 中 ， 你 有 机 会 编写 以 下 函数 : 


void reverseQueue (Queue<string> & queue); 


该 函数 完全 从 用 户 角度 逆向 排序 了 队列 中 的 元 素 。 然 而 ， 如 果 你 是 一 名 类 的 设计 者 ， 可 以 将 这 个 功 
能 添加 到 queue .h 接口 ， 并 作为 其 中 一 种 方法 提供 给 用 户 。 对 于 队列 基于 数组 和 基于 链表 这 两 种 
实现 方法 ,编写 方法 : 


void reverse(); 


这 个 方法 逆向 排序 队列 中 的 元 素 。 在 基于 数组 与 基于 链表 实现 的 两 种 情况 下 ， 编 写 这 个 函数 使 得 它 
们 使 用 原来 的 内 存 空间 ， 而 不 需要 分 配额 外 的 存储 空间 。 


. 在 本 章 展示 的 队列 抽象 中 ， 新 的 项 总 是 被 添加 到 队列 的 末尾 ， 并 依次 等 待 处 理 。 对 于 某 些 程序 应 用 ， 


将 简单 的 队列 抽象 扩展 为 优先 级 队列 是 很 有 用 的 ， 其 中 ,项 的 顺序 是 由 一 个 数字 化 优先 值 决 定 的 。 
一 个 项 在 优先 级 队列 中 入 列 后 ， 它 被 插入 到 所 有 比 它 低 优先 级 项 的 前 面 。 如 果 队 列 中 有 两 个 项 的 优 
先 级 相同 ， 它 们 将 按照 标准 的 先进 先 出 顺序 处 理 。 

使 用 队列 的 链表 实现 方法 作为 一 个 模型 ， 设 计 并 实现 一 个 pqueue .h 接口， 要求 接 口 提供 一 个 
被 称 为 PriorityQueue 的 类 ， 和 传统 的 Queue 类 一 样 ， 除 了 enqueue J, PriorityQueue 
的 类 应 和 Queue 类 一 样 提供 相同 的 方法 ，enqueue 方法 现在 有 一 个 额外 的 参数 ， 如 下 所 示 : 


void enqueue(ValueType value, double priority); 


参数 value 和 传统 的 enqueue 版 本 中 的 参数 相同 ，priority 参数 是 一 个 表示 优先 级 的 数值 。 
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正如 在 传统 的 英语 用 法 中 一 样 ， 小 的 整数 对 应 高 优先 级 ， 因 此 优先 级 1 在 优先 级 2 的 前 面 ， 以 此 

9. 为 Vectot 类 设计 一 个 可 用 不 同类 型 值 进行 测试 的 单元 测试 。 

10. 重 写 vector .h， 它 使 用 链表 作为 其 基本 表示 。 确 保 它 通过 你 为 前 面 的 习题 设计 的 单元 测试 。 

11. 使 用 12.4 节 中 vector 实现 方法 的 技术 来 实现 Grid 类 ， 除 了 [] 选 择 操作 ， 它 对 于 一 个 二 维 结构 
的 编码 更 环 手 。 

12. 在 第 12 章 的 习题 9 中 ， 要 求 你 使 用 一 个 被 称 为 MYString 的 类 ， 该 类 要 尽 可 能 地 复制 C++ KE 
中 string 类 的 行为 。 对 于 本 题 而 言 ， 重 新 实现 Mystring， 它 使 用 一 个 字符 链表 来 代替 一 个 动 
态 数组 作为 它 的 基本 表示 。 

13. 在 新 型 机 器 上 ， 使 用 64 位 来 存储 数据 类 型 long 的 值 ， 这 意味 着 类 型 long 的 最 大 正 值 是 
9 223 372 036 854 775 807， 也 就 是 22-1。 尽 管 这 个 数 看 起 来 很 大 ， 但 仍 有 一 些 应 用 需要 更 大 的 
整数 。 例 如 ， 如 果 要 求 你 计算 有 52 张 牌 的 一 副 牌 所 有 可 能 的 排列 情况 ， 你 需要 计算 52!， 它 的 结 
果 是 : 


80658175170943878571660636856403766975289505440883277824000000000000 


如 果 你 正在 解决 的 问题 涉及 的 整数 值 在 这 个 范围 内 (例如 ， 它 经 常 出 现在 密码 系统 中 )， 那 么 需要 
一 个 提供 扩展 精度 运算 ( extended-precision arithmetic) 的 软件 包 ， 其 中 整数 被 表示 在 一 个 能 够 允 
许 它们 自动 扩展 的 表格 中 。 

尽管 有 更 多 有 效 的 技术 可 以 这 样 做 ， 一 种 实现 扩展 精度 运算 的 策略 是 在 一 个 链表 中 存储 单独 
的 数字 。 在 这 种 表示 中 ， 能 很 方便 (大 部 分 是 因为 这 样 做 使 得 运算 操作 符 更 容易 实现 ) 排列 链表 ， 
使 得 个 位 数 首先 出 现 ， 后 面 跟着 十 位 数 ， 然 后 是 百 位 数 ， 以 此 类 推 。 因 此 ， 为 了 将 数 1729 表示 为 
一 个 链表 ， 你 要 按照 下 面 的 顺序 排列 表 : 


从 这 个 方向 读 取 数 


E 一 一 
TEEB 
Ls Le Xe 

设计 并 实现 一 个 被 称 为 BigInt 的 类 ， 至 少 对 于 非 负数 ， 要 求 它 使 用 这 种 表示 方法 实现 扩展 
精度 运算 。 你 的 BigInt 类 至 少 应 该 支持 以 下 操作 : 
e. 一 个 构造 函数 ， 该 函数 从 一 个 int 或 一 个 数字 字符 串 创建 一 个 BigInt WR. 
e 一 个 toString 方法， 该 方法 将 一 个 BigInt 对 象 转化 成 一 个 字符 捉 。 
e 操作 符 + 和 *， 分别 表 示 加 法 和 乘法 。 
如 果 你 亲自 动手 实现 这 些 运算 ， 通 过 模拟 你 所 做 的 工作 ， 可 以 实现 这 个 算术 运算 。 例 如 ， 加 法 要 
求 你 跟踪 从 一 个 数字 位 置 到 下 一 个 数字 位 置 的 移动 过 程 。 乘 法 更 困难 一 些 , 但 是 如 果 你 找到 正确 
的 迭代 分 解 ， 它 仍然 很 容易 实现 。 
使 用 你 的 BigInt 类 产生 一 张 表 ， 表 展示 了 n! 的 值 , 2 是 0 到 5$2 之 间 所 有 可 能 的 值 ， 包 括 0 和 
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Meo 5 


当 你 愿意 思考 一 些 事情 时 ， 研 究 地 图 是 一 件 不 错 的 事 。 
一 一 乔治 Ho, ( KAR ZF) (Middlemarch), 1874 


本 书 中 你 遇 到 的 最 有 用 的 数据 结构 之 一 是 映射 ， 它 实现 了 键 与 值 的 关联 关系 。 第 5 章 介 
绍 了 两 个 类 (Map 和 HashMap)， 它 们 都 实现 了 映射 的 概念 。 这 两 个 类 实现 了 同样 的 方法 ， 
并 且 经 常 能 够 相互 替换 使 用 ， 其 主要 区 别 是 在 遍历 其 中 的 元 素 时 键 的 处 理 顺 序 。HashMap 
更 高 效 ， 但 以 一 个 看 似 随 机 的 顺序 遍历 其 键 。Map 的 效率 稍 低 ， 但 是 它 的 优点 是 按照 键 的 自 
然 顺序 遍历 其 元 素 。 

下 面 两 章 的 目标 是 看 看 这 两 个 类 是 如 何 实现 的 。 本 章 的 重点 在 于 HashMap 类 ， 它 使 得 
在 常数 时 间 内 找到 一 个 键 所 关联 的 值 成 为 可 能 。 之 后 的 第 16 章 将 介绍 树 的 概念 。 虽 然 树 还 
有 很 多 其 他 应 用 ,但 是 它 为 Map 提供 了 基础 框架 。 这 个 框架 在 提供 了 对 数 时 间 操 作 的 同时 
保留 了 按 顺 序 处 理 键 的 能 力 。 

正如 你 在 阅读 第 14 章 中 的 较 长 代码 时 所 发 现 的 : 使 用 模板 定义 泛 型 集合 类 会 引起 大 量 
的 复杂 性 。 虽 然 模板 在 集合 类 的 库 版 本 中 很 重要 ， 但 是 它 所 需要 的 额外 复杂 性 很 容易 妨碍 你 
理解 用 于 实现 映射 想法 的 算法 结构 。 由 于 这 个 原因 ， 下 面 的 几 节 实现 了 一 个 相对 简单 的 类 ， 
称 为 StringMap 类 ， 在 该 类 中 键 和 值 都 是 字符 串 类 型 。 为 了 进一步 简化 ，StringMap 类 的 
公有 部 分 仅 导 出 那些 对 映射 抽象 具有 重要 性 的 put 和 get F. StringMap 的 公共 接口 
如 图 15-1 所 示 。 


/* 
* File: stringmap.h 
* 


~ 


* This interface exports a simplified version of the Map class in which 
* the keys and values are always strings. 
ui 

#ifndef  stringmap h 

#define  stringmap h 

#include <string> 


#include “vector.h" 
class StringMap { 


public: 

/* 
* Constructor: StringMap 
* Usage: StringMap map; 
* 


* Initializes a new empty map that uses strings as both keys and values. 
iad 


StringMap(); 
/* 





* Frees any heap storage associated with this map. 
* 


图 15-1 为 映射 抽象 简化 的 接口 
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~StringMap () ; 


* 

* Method: get 

* Usage: string value - map.get (key); 
* 


* Returns the value for key or the empty string, if key is unbound. 
* 


std::string get(const std::string & key) const; 


* 
* Method: put 
* Usage: map put(key, value); 


* Associates key with value in this map. 
n 


void put(const std::string & key, const std::string & value); 
The private section of rhe class goes here. 


#endif 
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15.1 使 用 矢量 实现 映射 


在 考虑 更 多 有 效 的 策略 之 前 ， 首 先 实现 基于 矢量 的 简单 StringMap 类 ， 这 对 于 理解 
StringMap 类 是 如 何 工作 的 将 很 有 帮助 。 一 个 特别 直接 的 方法 就 是 跟踪 矢量 中 的 键 - 值 
对 ， 其 中 每 个 元 素 都 是 一 个 结构 体 成 员 ， 定 义 如 下 : 

struct KeyValuePair ( 

string key; 
string value; 

) 
考虑 到 这 个 类 型 是 StringMap 类 的 一 部 分 ，key 和 value 域 的 类 型 都 是 string 类 型 。 
基于 模板 的 实现 都 会 使 用 类 似 的 结构 ， 其 中 两 个 string 类 的 实例 将 被 模板 参数 KeyType 
All ValueType 所 代替 ， 稍 后 你 将 会 在 本 章 中 看 到 。 

基于 矢量 版 本 的 StringMap 类 的 私有 部 分 如 图 15-2 所 示 。 对 键 的 绑 定 保存 在 一 个 称 为 
bindings 的 类 KeyValuePair RE, bindings 是 作为 该 类 的 一 个 实例 变量 被 存储 的 。 

基于 矢量 版 本 的 StringMap 类 的 实现 如 图 15-3 所 示 。 这 个 实现 大 部 分 都 很 简单 。 构 
造 函 数 和 析 构 函数 都 没有 代码 ， 原 因 在 于 Vector 类 执行 它 自己 的 存储 管理 。get 和 put 
方法 必须 搜索 已 存在 的 键 ， 因 此 把 搜索 矢量 这 一 过 程 交 给 一 个 叫做 findKey 的 私有 方法 ， 
这 对 于 get 和 put 这 两 种 方法 是 很 有 意义 的 。findKey 看 起 来 如 下 所 示 : 


int findKey(string key) ( 
for (int i = 0; i < bindings.size(); i++) { 
if (bindings.get(i).key == key) return i; 
} 
return -1; 


) 


这 个 方法 返回 特定 的 已 包含 在 bindings 矢量 中 的 键 值 在 键 列表 中 所 处 的 索引 值 。 如 果 这 
个 键 值 不 存在 ，f indKey 返回 -1。 使 用 线性 查找 算法 意味 着 get 和 put 方法 所 需 的 时 间 
都 是 O(N). 
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/* 


* Notes on the representation 


* This version of the StringMap class stores key-value pairs in a Vector. 


gi 


private: 


/* 
* Type: KeyValuePair 


* This type combines a key and a value into a single structure. 
x 


struct KeyValuePair ( 
std::string key; 
std::string value; 


m 

Instance variables */ 

Vector«KeyValuePair» bindings; 

Private function prototypes */ 

int findKey(const std::string & key) const; 





图 15-2 基于 矢量 实现 的 StringMap 类 的 私有 部 分 
/* 


* This file implements the stringmap.h interface. 


dd 


#include <string> 
#include "stringmap.h" 
using namespace std; 


/* 


* Implementation notes: StringMap constructor and destructor 
* 


* All dynamic allocation is handled by the Vector class. 
Wf 


StringMap::StringMap() ( } 
StringMap::~StringMap() { ) 


/* 


* Implementation notes: put, 


* These methods use findKey to search for the specified key. 


m/f 


string StringMap::get (const string & key) const { 
int index = findKey (key) ; 
return (index == -1) ? "" : bindings.get (index) .value; 


) 


void StringMap::put(const string & key, const string & value) ( 
int index - findKey (key); 
if (index -- -1) ( 
KeyValuePair entry; 
entry.key - key; 
index - bindings.size(); 
bindings .add (entry); 


) 


bindings[index].value - value; 


) 
/* 


* Private method: findKey 


* Returns the index at which the key appears, or -1 if the key is not found. 


wf 





图 15-3 基于 矢量 实现 的 StringMap 类 的 代码 











int StringMap::findKey (const string & key) const { 
for (int i = 0; i < bindings.size(); i++) { 
if (bindings.get(i).key == key) return i; 


return -1; 


) 
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通过 将 键 按 顺序 排序 并 应 用 7.5 节 所 介绍 的 二 分 查找 算法 可 以 改善 get 方法 的 性 能 。 二 
分 查找 可 以 将 查找 时 间 降 低 到 O (log N)， 这 表明 相 比 线性 查找 所 需要 的 时 间 O (NV) 而 言 ， 
查找 性 能 有 了 明显 提高 。 遗 憾 的 是 ， 并 没有 一 个 显而易见 的 方法 能 将 同样 的 优化 应 用 于 put 
方法 。 尽 管 在 O (log N) 时 间 内 检查 特定 的 键 是 否 已 存在 于 一 个 map 中 (甚至 确定 一 个 新 的 
键 需要 被 插入 的 确切 位 置 ) 是 可 能 的 ， 但 在 某 个 位 置 插 人 一 个 新 的 键 - 值 对 ， 需 要 向 前 移动 
插入 位 置 后 的 每 一 个 元 素 。 因 此 ， 即 使 在 一 个 排 好 序 的 列表 中 ，put 方法 也 需要 O (N) 的 
时 间 。 
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编程 时 经 常会 遇 到 映射 抽象 问题 ， 因 此 有 必要 投入 巨大 的 努力 提高 它 的 性 能 。 前 面 章节 
描述 的 实现 策略 (将 排 好 序 的 键 - 值 对 存储 在 矢量 中 ) 对 get 操作 给 出 了 O (log N) 的 时 间 
PERE, put 操作 的 时 间 性 能 为 O(N)。 我 们 可 以 把 它们 做 得 更 好 。 

当 你 努力 优化 一 个 数据 结构 的 性 能 时 ， 首 先 选择 一 些 特殊 的 情况 使 得 性 能 得 到 改进 ， 继 
而 寻找 一 些 方法 来 使 算法 更 加 通用 。 本 节 引 入 了 一 个 特定 的 问题 ， 我 们 可 以 很 容易 地 找到 一 
种 对 get 和 put 操作 的 常量 时 间 的 实现 方法 。 之 后 继续 探究 一 种 类 似 的 技术 如 何在 更 普遍 
的 情况 下 也 会 有 所 帮助 。 

1963 年 ， 美 国 邮政 服务 提出 用 一 组 两 个 字母 的 代码 表示 美国 各 个 州 和 地 区 的 方案 。50 
个 州 的 代码 表示 如 图 15-4 所 示 。 尽 管 你 想 要 从 相反 的 方向 翻译 ， 但 是 本 节 仅 考虑 把 两 个 字 
母 的 代码 翻译 成 州 名 的 问题 。 因 此 你 选择 的 数据 结构 必须 能 够 表示 从 两 个 字母 的 缩写 到 州 名 
的 映射 。 


AK Alaska Hawaii ME Maine NJ New Jersey SD South Dakota 
AL Alabama Iowa MI Michigan NM New Mexico TN Tennessee 
AR Arkansas Idaho MN Minnesota NV Nevada TX Texas 

AZ Arizona Illinois MO Missouri NY New York UT Utah 

CA California IN Indiana MS Mississippi OH Ohio VA Virginia 


CO Colorado KS Kansas MT Montana OK Oklahoma VT Vermont 

CT Connecticut KY Kentucky NC North Carolina OR Oregon WA Washington 
DE Delaware LA Louisiana ND North Dakota PA Pennsylvania WI Wisconsin 
FL Florida MA Massachusetts NE Nebraska RI Rhode Island WV West Virginia 
GA Georgia MD Maryland NH New Hampshire SC South Carolina WY Wyoming 


图 15-4 用 于 美国 邮政 服务 的 50 个 州 的 缩写 


当然 ， 你 可 以 将 上 述 翻 译 表 编码 在 一 个 StringMap 中 ,或 更 一 般 的 Map<sString, 
String» 中 。 然 而 ， 如 果 你 严格 地 从 用 户 的 角度 看 这 个 问题 ,那么 实现 的 细节 就 不 是 特别 
重要 。 本 章 的 目的 是 确定 一 种 使 映射 操作 更 有 效 的 新 实现 方法 。 在 这 个 例子 中 ， 要 问 一 个 重 
要 的 问题 : 把 两 个 字母 的 字符 串 作 为 键 是 否 比 使 用 基于 矢量 的 策略 的 实现 方法 具有 更 高 的 
效率 。 
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事实 证 明 ， 两 个 字符 的 键 的 限制 降低 了 查找 操作 的 复杂 性 ， 并 把 时 间 降 到 了 常量 时 间 。 
你 需要 把 州 的 名 字 存 到 一 个 二 维 的 表格 中 ， 而 在 这 个 表格 中 ， 行 和 列 的 索引 用 州 名 缩写 中 的 
字母 来 计算 。 为 了 从 表格 中 选 出 某 个 特定 的 元 素 ， 你 可 以 简单 地 把 州 的 缩写 分 解 成 它 所 包含 
的 两 个 字符 ， 每 个 字符 减 去 'A' 的 ASCII 码 值 ， 得 到 一 个 介 于 0 到 25 之 间 的 索引 ， 然 后 使 
用 这 两 个 索引 选择 行 和 列 。 在 图 15-5 中 ， 给 出 了 pt ee te tt 你 
可 以 使 用 下 面 的 函数 把 一 个 州 的 缩写 转换 成 对 应 的 州 名 : 


string getStateName(string key, Grid<string> & grid) { 


char row - key[0] - 'A'; 
char col = key[1] - 'A'; 
if (!grid.inBounds(row, col) || grid[row] [col] == "") ( 


error("No state name for " + abbr); 
) 


return grid[row][col]; 
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K 15-5 州 查找 表 的 前 9 列 


该 函数 不 包括 任何 看 起 来 像 查找 数组 元 素 的 传统 过 程 。 取 而 代 之 的 是 : 函数 对 字符 的 码 
值 执行 简单 的 算术 运算 ， 然 后 在 表格 里 寻找 答案 。 在 其 实现 中 ， 既 没有 循环 也 没有 任何 依赖 
于 映射 中 的 键 的 数量 代码 。 因 此 ， 在 这 个 表 中 ， 查 找 一 个 缩写 花费 的 时 间 是 0 (1)。 

函数 getStateName 使 用 的 表格 是 查找 表 (lookup table) 的 一 个 例子 。 查 找 表 是 一 种 
程序 结构 ， 它 可 以 通过 计算 表 中 适当 的 索引 获得 一 个 想 要 的 值 ， 最 典型 的 就 是 矢量 或 者 表 
格 。 查 找 表 高 效 的 原因 在 于 其 键 可 以 立即 告诉 你 去 哪里 找 答 案 。 然 而 ， 在 当前 的 应 用 程序 
中 ， 表 的 组 织 依赖 于 这 样 一 个 事实 : 键 总 是 包含 两 个 大 写字 母 。 如 果 键 可 以 是 任意 的 字符 串 
(就 像 标准 库 版 本 中 的 Map 类 )， 那 么 至 少 以 它 当 前 的 形式 ， 查 找 表 将 不 再 适用 。 问 题 的 关键 
在 于 是 否 能 够 推广 这 种 策略 以 把 它 应 用 到 更 一 般 的 情况 。 
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如 果 你 思考 一 下 如 何 把 这 个 问题 运用 到 现实 生活 中 ， 或 许 会 发 现 : 事实 上 ， 你 在 字典 里 
查找 单词 的 过 程 ， 就 使 用 了 与 查找 表 类 似 的 策略 。 如 果 你 打算 把 基于 矢量 的 映射 应 用 于 字典 
的 查找 问题 ， 你 会 从 第 一 个 条 目 开 始 ， 接 着 是 第 二 个 、 第 三 个 ， 直 到 找到 那个 单词 为 止 。 当 
然 没 有 人 会 把 这 个 算法 应 用 到 一 个 真正 任意 大 小 的 字典 中 。 但 是 你 不 可 能 应 用 O (log N) = 
分 查找 算法 ( 它 包括 准确 地 打开 字典 的 中 间 部 分 ) 确定 你 要 找 的 单词 是 在 第 一 部 分 还 是 在 第 
二 部 分 ， 然 后 重复 地 应 用 这 个 算法 到 字典 越 来 越 小 的 部 分 。 极 有 可 能 ， 你 会 利用 很 多 字典 侧 
面 都 有 拇指 标签 这 个 事实 ,拇指 标签 表明 每 个 字母 出 现 的 条 目 在 哪里 。 你 在 A 区 域 找 以 A 
开头 的 单词 ， 在 B 区 域 找 以 B 开头 的 单词 ， 以 此 类 推 。 这 些 拇指 标签 就 代表 了 一 个 查找 表 ， 
它 使 得 你 能 找到 正确 的 区 域 ， 从 而 降低 需要 查找 的 单词 数量 。 

至 少 对 于 像 StringMap 这 种 使 用 字符 串 作 为 键 类 型 的 映射 ,我 们 可 以 使 用 同样 的 策 
略 。 在 这 种 类 型 的 映射 中 ， 即 使 那个 字符 不 一 定 是 一 个 字母 ， 但 每 一 个 键 仍 以 某 个 字符 值 开 
始 。 如 果 你 想 为 每 个 可 能 的 首 字 符 模拟 使 用 拇指 标签 的 策略 ， 可 以 把 映射 分 成 256 个 单独 由 
BE - 值 对 构成 的 列表 (为 每 个 首 字符 提供 一 个 )。 用 户 无 论 何 时 使 用 某 个 键 调用 put 和 get 
方法 ， 代 码 都 可 以 依据 第 一 个 字符 选择 出 合适 的 列表 。 如 果 用 于 构成 键 的 字符 是 均匀 分 布 
的 ， 则 该 策略 就 能 够 将 平均 查找 时 间 降 低 到 原来 的 1/256。 

遗憾 的 是 ， 一 个 映射 中 的 键 (类 似 于 字典 中 的 单词 ) 并 不 是 均匀 分 布 的 。 例 如 ， 在 字典 
中 ， 以 C 开头 的 单词 就 要 比 以 X 开 头 的 单词 多 得 多 。 如 果 你 在 一 个 应 用 程序 中 使 用 映射 ， 
有 可 能 256 个 字符 中 大 多 数 都 不 会 以 首 字符 的 身份 出 现 。 因 此 ， 一 些 键 列 表 会 是 空 的 ， 而 另 
外 一 些 键 列表 会 很 长 。 因 此 ， 通 过 使 用 首 字符 策略 得 到 的 效率 层面 的 提升 依赖 于 键 首 字符 可 
能 出 现 的 普遍 程度 。 

另 一 方面 ， 你 没有 理由 仅 使 用 键 的 首 字符 去 优化 映射 的 性 能 。 首 字符 策略 是 对 真实 字 
典 的 一 个 贴切 模拟 。 你 需要 这 样 一 个 策略 : 其 中 键 的 值 可 以 表明 其 对 应 的 值 的 位 置 ， 就 
像 查 找 表 那样 。 该 想法 的 最 好 实现 就 是 使 用 称 为 哈 希 ( hashing) 的 技术 ， 该 技术 将 在 下 节 
描述 。 


15.3 RA 


提高 映射 实现 效率 的 最 好 方法 就 是 提出 一 个 使 用 键 确定 (或 至 少 去 接近 ) 对 应 位 置 值 的 
方法 。 选 择 键 的 任意 一 个 明显 的 特征 ， 例 如 它 的 首 字符 ， 甚 至 是 它 的 前 两 个 字符 ， 都 会 遇 到 
键 特性 分 布 不 均匀 的 问题 。 

然而 ， 既 然 你 在 使 用 计算 机 ， 那 么 就 没有 理由 要 求 定位 键 的 特征 必须 是 人 容易 识别 的 东 
西 。 为 了 维护 实现 的 效率 ， 对 计算 机 而 言 ， 唯 一 重要 的 是 该 特征 是 否 容 易 确定 。 由 于 计算 机 
比 人 更 善于 计算 ， 因此， 允许 算法 开辟 更 广阔 的 范围 。 

称 为 哈 希 操作 的 计算 策略 如 下 : 

1. 选择 一 个 函数 /， 它 把 键 转换 成 一 个 整数 值 ， 该 整数 值 被 称 为 键 的 哈 希 码 (hash 
code)。 计 算 哈 希 码 的 这 个 函数 自然 地 被 称 为 哈 希 函数 ( hash function)。 使 用 该 策略 的 映射 
抽象 的 实现 习惯 上 被 称 为 哈 希 表 (hash table). 

2. 在 表 中 查找 匹配 的 键 时 ， 以 键 的 哈 希 码 作为 起 点 。 


15.3.1 设计 数据 结构 
将 StringMap 类 实现 为 哈 希 表 的 第 一 步 是 设计 其 数据 结构 。 虽 然 其 他 的 表示 也 是 可 行 
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的 ， 但 是 一 个 通用 的 策略 应 该 是 使 用 哈 希 码 计算 一 个 到 链表 数组 的 索引 ， 每 个 链表 包含 所 有 
和 该 哈 希 码 相 匹配 的 键 — 值 对 。 这 些 链表 习惯 上 被 称 为 桶 (bucket)。 为 了 找到 你 要 查找 的 
键 ， 需 要 在 桶 中 遍历 键 — 值 对 链表 。 
在 绝 大 多 数 哈 希 实现 中 ， 可 能 的 哈 希 码 的 数量 都 大 于 桶 的 数量 。 但 是 ， 你 可 以 把 一 个 任 
意 大 的 非 负 哈 希 码 转换 成 一 个 桶 数 ， 通 过 计算 哈 希 码 除 以 桶 数 来 得 到 其 余数 。 因 此 ， 如 果 桶 
数 被 存储 在 变量 nBuckets 'P, MM hashCode 对 给 出 的 键 将 返回 其 哈 希 码 ， 你 可 以 按照 
如 下 方式 计算 桶 数 : 


int bucket = hashCode(key) % nBuckets; 


桶 数 代 表 了 一 个 数组 的 索引 ， 数 组 中 的 每 个 元 素 都 是 键 - 值 对 列表 中 第 一 个 单元 的 
地 址 。 通 俗 地 讲 ， 如 果 一 个 关于 键 的 哈 希 函数 返回 了 经 过 取 余 操作 的 桶 数 ， 计 算 机 科学 
家 就 会 说 一 个 键 哈 希 到 一 个 桶 里 (hashes to a bucket)。 因 此 ， 同 一 个 链表 中 所 有 键 的 共 
同 特征 是 它们 都 能 哈 希 到 同一 个 桶 里 。 两 个 或 多 个 不 同 的 键 哈 希 到 同一 个 桶 里 被 称 为 冲突 
(collision) 。 

哈 希 有 效 的 原因 在 于 : 对 于 任意 特定 的 键 ， 哈 希 函 数 总 是 返回 相同 的 值 。 如 果 一 个 键 
被 哈 希 到 17 号 桶 中 ， 当 你 调用 put 函数 把 该 键 插入 哈 希 表 中 时 ， 它 就 被 哈 希 到 17 号 桶 中 ， 
当 你 调用 get 函数 查找 键 对 应 的 值 时 ， 该 键 将 仍然 被 哈 希 到 17 号 桶 中 。 


15.3.2 为 字符 串 定 义 哈 希 函数 


实现 的 下 一 步 就 是 定义 hashCcode 函数 。 在 StringMap 类 这 个 例子 中 ，hashCcode 
函数 必须 得 到 一 个 string 类 型 的 键 ， 然 后 返回 一 个 非 负 整 数 。 为 了 达到 哈 希 表 的 高 效 性 ， 
hashCode 函数 必须 具有 以 下 两 个 特性 : 

1. 子 数 的 计算 代价 不 能 太 高 。 如 果 你 设计 的 哈 希 函数 太 复杂 ， 那 就 要 花费 很 多 时 间 去 计 
算 。 哈 希 函 数 涉 及 的 操作 应 相对 容易 实现 。 

2. 函数 应 该 将 键 尽量 均匀 地 分 布 在 一 个 整数 区 间 内 。 如 果 将 冲突 的 数目 降 到 最 低 ， 则 哈 
硕 函 数 的 效率 最 高 。 如 果 常 用 的 键 返 回 相同 的 哈 希 码 ， 这 些 桶 的 链表 会 变 得 很 长 m Hu 
很 长 的 查找 时 间 。 

虽然 哈 希 函数 通常 都 很 得， 但 是 哈 希 函数 特别 敏感 ， 而 且 经 常 依赖 于 复杂 的 数学 。 一 
般 情 况 下 ， 编 写 哈 希 函数 的 工作 最 好 留 给 专家 。Stanford 类 库 对 HashMap 类 的 实现 采用 
了 如 图 15-6 所 示 的 基于 字符 串 的 哈 希 函数 ， 它 是 由 芝加哥 伊利 诺 伊 大 学 数学 系 的 教授 丹 尼 
AK + 斯 蒂 文 杨 (Daniel J. Bernstein) 设计 的 。 


* Implementation notes: hashCode 
* 


This function takes a string key and uses it to derive a hash code, 
which is nonnegative integer related to the key by a deterministic 
* function that distributes keys well across the space of integers. 
* The specific algorithm used here is called djb2 after the initials 
* of its inventor, Daniel J. Bernstein, Professor of Mathematics at 
* the University of Illinois at Chicago. 
*/ 


const int HASH SEED = 5381; /* Starting point for first cytle */ 
const int HASH MULTIPLIER = 33; /* Multiplier for each cycle * / 
const int HASH MASK = unsigned(-1) >> 1; /* The largest positive integer xj 





Al 15-6 字符 串 nashcode 函数 的 实现 
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int hashCode(const string & str) ( 
unsigned hash - HASH SEED; 
int n = str.length(); 


for (int i = 0; i < n; i++) 

hash = HASH MULTIPLIER * hash + str[i]; 
) 
return int(hash & HASH MASK); 





图 15-6 (£5) 


在 任何 特定 的 库 中 ， 用 于 字符 串 的 哈 希 函数 或 许 和 这 个 完全 不 一 样 ， 但 是 大 多 数 的 实 
现 都 有 相似 的 结构 。 在 这 个 实现 中 ,代码 循环 遍历 键 中 的 每 一 个 字符 ， 更 新 存储 在 局 部 变 
tí hash 中 的 值 ， 该 局 部 变量 hash 被 声明 为 一 个 unsigned 整数 ， 并 且 初 始 化 为 一 个 看 
似 随机 的 常数 5381。 在 每 次 循环 中 ，hashcode 函数 把 之 前 的 hash 值 和 一 个 称 为 HASH_ 
MULTIPLIER 的 常量 相 乘 ， 然 后 加 上 当前 字符 的 ASCII 码 值 。 在 循环 的 最 后 ， 结 果 不 是 
hash 值 ， 而 是 用 奇怪 的 表达 式 计 算出 来 的 : 


int (hash & HASH MASK) 


考虑 到 在 如 此 短 的 函数 中 有 许多 令 人 困惑 的 代码 ， 你 应 该 认同 没有 必要 对 复杂 的 hash- 
Code 函数 进行 详细 理解 。 所 有 复杂 性 的 关键 是 确保 hashCode 函数 的 结果 均匀 地 分 布 在 一 
个 非 负 的 整数 区 间 。 用 户 并 不 关心 函数 如 何 实现 这 个 目标 的 细节 ， 他 们 在 意 的 是 其 本 身 作为 
一 个 理论 问题 的 结果 。 

你 选择 哪个 hashCode 函数 对 实现 的 效率 影响 很 大 。 例 如 ， 如 果 你 用 下 面相 对 简单 的 
实现 ， 想 一 下 会 发 生 什么 : 


int hashCode(const string & str) ( 


int hash = 0; 
int n = str.length(); M 
for (int i = 0; i < n; i++) { 

hash += str[i]; 


} 
return hash; 
} 


这 段 代 码 很 难 理解 。 它 的 所 有 功能 就 是 将 字符 串 中 字符 的 ASCII 码 值 加 起 来 ， 除 非 字 符 串 
特别 长 ， 否 则 这 个 值 是 一 个 非 负 整数 。 遗 憾 的 是 ， 除 了 长 字符 串 会 引起 整数 溢出 并 导致 负数 
结果 外 ， 按 这 种 方法 编写 hashcode ， 如 果 哈 希 表 的 键 刚好 陷 人 某 个 模式 ， 将 很 有 可 能 会 导 
致 哈 希 表 冲 突 。 加 ACSII 码 值 的 策略 意味 着 任何 彼此 字母 是 置换 关系 的 键 都 会 有 冲突 。 因 
此 ，cat 和 act 会 哈 希 到 同一 个 桶 中 。 关 键 码 a3、b2 和 cl 也 是 如 此 。 如 果 你 将 该 哈 希 表 
应 用 于 一 个 编译 程序 中 ， 与 这 个 模式 相 适 应 的 变量 名 最 后 将 全 都 哈 希 到 相同 的 桶 中 。 

以 hashCode 函数 的 实现 代码 更 隐 汲 难 懂 为 代价 ， 你 可 以 降低 相似 键 冲突 的 可 能 
性 。 但 是 ， 理 解 如 何 设计 一 个 哈 希 函数 需要 相当 多 计算 机 科学 理论 的 高 深 知 识 。 大 多 数 
hashCode 函数 的 实现 使 用 了 如 第 2 章 所 述 的 与 产生 伪 随 机 数 相 似 的 技术 。 在 一 个 值 域 区 
间 中 ， 结 果 难 以 预测 是 非常 重要 的 。 在 哈 希 表 中 ， 这 种 不 可 预测 的 结果 正 是 程序 员 所 选择 的 
E, 它们 是 不 可 能 呈 显 出 比 偶然 的 期 望 更 高 的 冲突 的 。 

虽然 仔细 地 设计 哈 希 函数 可 以 降低 冲突 的 数目 并 提高 其 性 能 ， 但 重要 的 是 必须 认识 到 算 
法 的 正确 性 不 能 被 冲突 率 所 影响 。 使 用 设计 很 差 的 哈 希 函数 的 实现 运行 很 慢 ， 但 能 给 出 正确 
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15.3.3 ”实现 哈 希 表 


一 旦 你 有 了 哈 希 函数 的 代码 ， 实 现 的 其 余部 分 就 相对 容易 编写 了 。StringMap 类 的 私 
有 部 分 如 图 15-7 所 示 ， 相 应 的 实现 展示 在 图 15-8 中 。 


Notes on the representation 


This version of the StringMap class uses a hash table that keeps the 
key-value pairs in an array of buckets, each of which is a linked list 
of keys that hash to that bucket. 

eg 


private: 


/* Type definition for cells in the bucket chain */ 


struct Cell ( 
std::string key; 
std::string value; 
Cell *link; 

) 


Constant definitions */ 
static const int INITIAL BUCKET COUNT - 13; 
Instance variables */ 


Cell **buckets; /* Dynamic array of pointers to cells */ 
int nBuckets; /* The number of buckets in the array */ 


Private methods */ 
Cell *findCell(int bucket, const std::string & key) const; 
Make copying illegal */ 


StringMap(const StringMap & src) ( ) 
StringMap & operator-(const StringMap & src) ( return *this; ) 





图 15-7 StringMap 类 哈 希 表 实现 的 私有 部 分 


File: stringmap.cpp 


This file implements the stringmap.h interface using a hash table 
as the underlying representation. 
*/ 
#include <string> 


#include "stringmap.h" 
using namespace std; 


Implementation notes: HashMap constructor and destructor 


The constructor allocates the array of buckets and initializes each 
bucket to the empty list. The destructor frees the allocated cells 
ey 


StringMap::StringMap() { 
nBuckets - INITIAL BUCKET COUNT; 
buckets = new Cell*[nBuckets]; 
for (int i = 0; i « nBuckets; i++) { 
buckets[i] - NULL; 
) 
) 


StringMap::-StringMap() ( 


图 15-8 StringMap 类 哈 希 表 的 实现 代码 
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for (int i = 0; i « nBuckets; i++) ( 


Cell *cp = buckets[i]; 

while (cp !- NULL) ( 
Cell *oldCell = cp; 
cp = cp-»link; 
delete oldCell; 


The get method calls findCell to 
matching key 


search the linked list for the 


If no key is found, get returns the empty string 


string StringMap::get(const string & key) const { 
int bucket - hashCode(key) * nBuckets; 
Cell *cp - findCell(bucket, key); 


return (cp -- NULL) ? "" 


The put method calls findCell to 
matching key. If a cell already 
value field If no matching key 


: cp-»value; 


search the linked list for the 
exists, put simply resets the 
is found, put adds a new cell 


to the beginning of the list for that chain. 


void StringMap::put(const string & key, const string & value) ( 
int. bucket - hashCode(key) * nBuckets; 
Cell *cp = findCell(bucket, key); 
if (cp -- NULL) ( 
cp = new Cell; 
cp->key = key; 
cp-»link = buckets [bucket]; 
buckets[bucket] = cp; 
) 


cp-»value - value; 


Private method: findCell 
Usage: Cell *cp - findCell(bucket, key); 


Finds a cell in the chain for the specified bucket that matches key. 
If a match is found, the return value is a pointer to the cell 
containing the matching key. If no match is found, findCell 
returns NULL 


StringMap::Cell *StringMap::findCell(int bucket, const string & key) const ( 
Cell *cp - buckets [bucket] ; 
while (cp != NULL && key != cp->key) ( 
cp = cp->link; 


return cp; 





图 15-8 (£&) 


StringMap 类 的 私有 部 分 定义 了 两 个 实例 变量 : 一 个 动态 数组 buckets 和 一 个 存储 
这 个 数组 大 小 的 整 型 变量 nBuckets。buckets 中 的 每 个 元 素 都 是 一 个 键 - 值 对 链表 ， 它 
根据 键 哈 希 到 相应 的 桶 中 。 每 个 链 中 的 单元 都 和 你 在 前 述 示例 中 看 到 的 链表 队列 类 似 ， 区 别 
是 它 的 每 个 单元 都 包含 一 个 键 - 值 对 。 在 这 个 程序 中 ， 桶 的 数目 是 个 常数 ， 但 之 后 的 实现 中 
将 会 对 其 进行 改变 。 

如 果 看 图 15-7 中 实例 变量 buckets 的 声明 ， 可 能 觉得 这 个 语法 初 看 起 来 有 点 奇怪 。 
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到 现在 为 止 ， 你 为 各 种 集合 类 创造 的 动态 数组 被 声明 为 指向 基本 类 型 的 指针 ， 在 这 种 情况 
下 ， 其 声明 为 : 


Cell **buckets; 


如 之 前 的 例子 ，buckets 是 一 个 动态 数组 ， 在 C++ 中 被 描述 为 一 个 指向 数组 初始 元 素 的 指 
针 。 而 且 每 个 元 素 都 是 一 个 指向 键 — 值 对 链表 中 第 一 个 单元 的 指针 。 因 此 变量 buckets 是 
一 个 指向 每 个 单元 指针 的 指针 , 这 就 是 上 述 声明 语句 中 双星 号 的 含义 。 


15.3.4 ”跟踪 蛤 希 表 的 实现 


理解 图 15-8 中 哈 希 表 的 实现 最 简单 的 办 法 是 完成 一 个 简单 的 例子 。 构 造 函 数 创建 一 个 
动态 数组 ， 并 且 把 buckets 数组 中 的 每 个 元 素 设置 为 NULL， 它 表明 这 是 一 个 空 链表 。 这 
个 结构 如 下 图 所 示 : 


buckets 
nBuckets 





假设 程序 之 后 执行 以 下 调用 : 
stateMap.put("AK", "Alaska"); 


put 函数 代码 的 第 一 步 是 计算 键 "AK" 的 桶 数 ， 这 需要 计算 nashCode("AK") 的 
fi. He hashCode 函数 的 代码 复杂 ， 但 至 少 按 步 又 运行 一 次 还 是 很 有 必要 的 。 如 
果 你 跟踪 如 图 15-6 所 示 的 hashCode 中 for 循环 的 每 次 执行 ， 会 看 到 执行 涉及 以 下 
步骤 : 
e 在 for 循环 开始 之 前 ， 变 量 hash 被 设置 为 常量 HASH_SEED， 其 值 为 5381。 
e 第 一 次 循环 通过 将 hash 的 初始 值 乘 以 33， 并 加 上 字符 'A' 的 ASCII 码 值 65 来 更 
新 变量 hash。 因 此 更 新 后 的 hash 值 是 33X5381 十 65， 即 结果 为 177 638. 
e 最 后 一 次 循环 再 一 次 用 把 hash 乘 以 33， 并 加 上 'K' 的 ASCII 码 值 75。hashcode 
函数 返回 的 值 是 33X177 6384-75, BI 5 862 129。 
桶 数 就 是 5 862 129 除 以 13 的 余数 ， 这 里 刚好 等 于 0。put 方法 因此 将 "ak" 关联 到 0 
号 桶 中 ， 而 这 个 桶 原本 是 空 的 。 所 以 结果 是 一 个 仅 包含 了 Alaska 这 个 单元 的 链表 ， 看 起 来 
如 下 图 所 示 : 


通过 相同 的 步 又， 你 可 以 发 现 "AL" 在 1 号 桶 中 。 
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最 后 ， 特 别 是 在 一 个 有 13 个 桶 的 哈 希 表 中 ， 会 发 生 一 个 冲突 。 例 如 ， 关 键 码 "KS" 也 
会 哈 希 到 0 FH. put 方法 的 代码 必须 遍历 索引 为 0 的 链表 以 找到 一 个 相 匹配 的 键 。 因 为 
"KS" 没有 出 现 ， 所 以 put 方法 在 链表 的 开头 加 入 一 个 新 单元 ， 如 下 图 所 示 : 





图 15-9 显示 了 50 个 州 的 缩写 如 何 纳 入 到 有 13 个 桶 的 表 中 。 缩 写 AK、KS、ME、RI 和 VT 
全 部 都 哈 希 到 0 号 桶 ，AL、MS、NY、OR、SC 和 WA 全 部 哈 希 到 1 号 桶 ， 以 此 类 推 。 通过 把 
键 分 配 到 不 同 的 桶 中 ，get 和 put 方法 就 可 以 搜索 一 个 比较 小 的 列表 。 同 时 ,依据 桶 数 而 
不 是 键 的 自然 顺序 来 排列 键 很 难 按 升序 遍历 键 。 为 了 能 按键 的 升序 遍历 键 ， 需 要 一 种 新 的 称 
为 树 (tree) 的 数据 结构 ， 它 将 在 第 16 章 描 述 。 


15.3.5 调整 桶 的 数目 


虽然 哈 希 函数 的 设计 很 重要 ,但 是 要 清楚 冲突 的 可 能 性 也 依赖 于 桶 的 数目 。 如 果 桶 数 很 
小 ， 冲 突 发 生 将 会 很 频繁 。 特 别 是 ， 如 果 哈 希 表 条 目 比 桶 数 多 ， 冲 突 将 不 可 避免 。 冲 突 影响 
到 哈 希 表 的 效率 ， 因 为 put 和 get 方法 必须 搜索 更 长 的 链表 。 当 哈 硕 表 被 填 满 时 ， 冲 突 率 
会 上 升 从 而 降低 其 性 能 。 

重要 的 是 记 住 这 一 点 : 使 用 哈 希 表 的 目的 是 优化 put 和 get 方法 以 便 它们 至 少 在 平均 
情况 下 的 常量 时 间 内 和 运行。 实现 这 个 目标 需要 每 个 桶 的 链表 要 短 ， 反 过 来 也 就 意味 着 桶 数 必 
须 大 于 表 的 条 目 数 。 假 设 哈 希 函数 能 够 很 好 地 将 键 均匀 地 分 配 到 各 个 桶 中 ， 则 每 个 桶 链 的 平 
均 长 度 可 用 下 面 的 公式 计算 : 

Nentries 
As Nbuckets 
例如 ， 如 果 表 中 条 目 总 数 是 桶 数 的 3 倍 ， 每 个 链 平均 包含 3 个 条 目 ， 也 就 是 说 为 了 找到 一 个 
键 平均 需要 3 个 字符 串 间 的 比较 。 这 个 比率 通常 都 可 用 希腊 字母 1 表示 ， 它 被 称 为 哈 希 表 的 
负荷 系数 (load factor). 

为 了 获得 更 好 的 哈 硕 表 性 能 ， 你 要 确保 4 很 小 。 虽 然 其 数学 细节 已 超出 了 本 书 的 范围 ， 
但 是 保持 负荷 系数 为 0.7 或 更 小 ， 意 味 着 在 映射 中 查找 一 个 键 的 平均 时 间 是 O (1)。 更 小 的 
负荷 系数 表明 哈 希 表 中 会 有 很 多 空 郴 ， 这 浪费 了 一 定 的 空间 。 哈 希 表 是 一 个 很 好 的 时 空 权衡 
的 实例 ， 时 空 权衡 这 一 概念 在 第 13 章 中 已 作 了 介绍 。 通 过 增加 哈 希 表 所 用 到 的 空间 ， 你 可 
以 提高 其 性 能 ， 但 是 把 负荷 系数 降低 到 阔 值 0.7 以 下 几乎 没有 任何 益处 。 

除非 哈 希 算法 是 为 某 个 特定 的 已 提前 告知 键 数 的 应 用 程序 而 设计 的 ， 否 则 我 们 不 可 能 为 
所 有 的 用 户 都 选择 一 个 固定 的 桶 数 nBuckets 值 ， 并 期 望 它 能 很 好 地 为 所 有 用 户 工作 。 如 
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图 15-9 包含 州 缩写 的 哈 希 表 


果 用 户 不 断 往 映 射 里 添加 条 目 ， 其 性 能 最 终 会 下 降 。 如 果 你 想 要 保持 良好 的 性 能 ， 最 好 的 办 
法 就 是 实现 桶 数 的 动态 增加 。 例 如 ， 你 可 以 设计 一 种 实现 ， 当 负荷 系数 达到 某 个 阔 值 时 ， 它 
可 以 重新 分 配 一 个 更 大 的 哈 希 表 。 遗 憾 的 是 ， 如 果 你 增加 桶 的 数目 ， 桶 数 中 的 内 容 将 全 部 改 
变 ， 这 意味 着 扩大 哈 希 表 的 代码 必须 从 旧 表 重新 输入 每 一 个 键 到 新 表 。 这 个 过 程 称 为 重 哈 希 
(rehashing)。 虽 然 重 哈 希 是 非常 耗 时 的 ， 但 是 它 不 经 常 被 执行 ， 所 以 对 应 用 程序 总 的 运行 时 
间 影 响 很 小 。 在 习题 5 中 ， 你 将 有 机 会 实现 这 个 重 哈 希 策略 。 


15.4 实现 HashMap 类 


到 目前 为 止 ， 本 章 的 代码 示例 已 实现 了 StringMap 接口 ， 而 不 是 第 5 章 介绍 的 普通 的 
HashMap 类 的 接口 。 完 成 HashMap 类 的 实现 ， 需 要 在 代码 上 做 以 下 改变 : 
e 添加 遗漏 的 方法 。 除 了 最 简化 的 StringMap 类 提供 的 put 和 get 方法 外 ，HashMap 


Be At 459 





类 还 提供 了 size, isEmpty, containsKey, remove 和 clear 方法 ， 以 及 能 
够 把 映射 当 作 关 联 数组 的 下 标 选择 运算 和 一 些 必要 的 对 深度 拷贝 提供 支持 的 拷贝 构 
造 函 数 和 重 载 的 赋值 操作 符 。 
e 泛 化 键 和 值 类 型 。HashMap 类 使 用 模板 参数 KeyType fll ValueType 给 用 户 更 大 
的 灵活 性 。 
在 很 大 程度 上 ， 上 述 变 化 都 是 显而易见 的 。 只 有 一 个 变化 有 一 些微 妙 之 处 ， 它 使 用 模板 功能 
支持 用 户 定制 的 键 类 型 。 l 
实现 哈 希 表 的 算法 对 键 的 类 型 有 以 下 几 点 要 求 : 
e 键 的 类 型 必须 是 可 赋值 的 ， 以 便 代 码 能 够 存储 哈 希 表单 元 中 键 的 副本 。 
e 键 的 类 型 必须 支持 == 比较 操作 符 ， 以 便 代码 可 以 区 别 两 个 键 是 否 相 同 。 
e HashMap 类 模板 扩展 的 时 候 ， 编 译 器 必须 使 用 hashcodae 函数 的 一 个 版 本 ,为 
键 类 型 的 每 一 个 值 产 生 一 个 非 负 整数 。 内 置 类 型 如 string 和 int， 其 函数 定 
义 在 hashmap .h 接口 中 。 对 那些 针对 特定 应 用 的 类 型 而 言 ， 其 函数 必须 由 用 户 
提供 。 
”在 很 多 情况 下 ,用 于 其 他 类 型 的 hashcodqe 函数 可 能 很 简单 。 例 如 ， 用 于 整数 的 哈 希 
函数 可 以 简单 地 表示 为 : 
int hashCode(int key) ( 
return key & HASH MASK; 
} 
常量 HASH MASK 5 15.3.2 小 节 中 定义 的 一 样 ， 包 括 除 符号 位 为 0 其 他 位 都 为 1 的 一 个 字 。 操 
作 符 & 将 在 第 18 章 进行 详细 讨论 ， 在 此 的 作用 是 从 key 中 去 除 符号 位 以 确保 其 hashCode 
值 不 为 负 。 
为 复合 类 型 编写 较 好 的 哈 希 函数 ， 通 常 需要 一 定 程度 的 数学 复杂 性 以 确保 哈 希 代码 均匀 
地 分 布 在 某 个 非 负 整数 区 间 。 但 是 ， 有 一 个 简单 的 权宜 之 计 ， 就 是 引入 tostring 方法 为 
任何 类 型 编写 出 一 个 合理 的 哈 希 函数 。 你 需要 把 数值 转变 成 字符 串 ， 然 后 使 用 哈 希 的 字符 串 
版 本 得 到 结果 。 使 用 这 种 方法 ， 你 可 以 编写 一 个 针对 Rational 类 的 hashcode 函数 ， 如 
下 所 示 : 


int hashCode(const Rational & r) ( 
return hashCode(r.toString()); 
) 


虽然 计算 这 个 函数 比 执行 除法 算术 运算 需要 更 多 的 时 间 ， 但 是 这 个 代码 更 容易 编写 。 


本 章 小 结 
本 章 主要 讨论 各 种 实现 基本 操作 的 策略 ， 它 们 由 HashMap 类 的 库 版 本 提供 。Map 类 能 
够 按 升 序 遍 历 键 ， 它 需要 一 个 更 复杂 的 数据 结构 树 ， 这 是 第 16 章 的 主题 。 
本 章 的 要 点 包括 : 
e 通过 把 键 - 值 对 存储 在 一 个 矢量 中 ， 可 以 实现 基本 的 映射 操作 。 保 持 矢量 的 排序 顺 
序 使 得 get 方法 的 运行 时 间 为 O (log N), 但 put FIN O(N). 
e 特定 的 应 用 通过 使 用 查找 表 来 实现 映射 操作 ，get 和 put 方法 的 运行 时 间 均 为 
0 (1). 
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e 采用 称 为 哈 希 的 策略 可 以 高 效 地 实现 Map 类 。 在 其 Map 类 的 实现 中 ， 键 被 转化 为 一 
个 整数 ， 它 可 以 确定 在 哪里 找到 其 对 应 的 值 结果 。 

e 一 个 通用 的 哈 希 算法 的 实现 是 分 配 一 个 动态 的 桶 数组 ， 每 个 桶 都 包含 一 个 哈 希 到 这 
个 桶 的 键 的 链表 。 只 要 Map 对 象 中 条 目 数 与 桶 数 的 比例 不 超过 0.7, get 和 put 方 
法 的 平均 执行 时 间 均 为 O (1)。 当 条 目 数 增长 时 ， 想 要 保持 这 样 的 性 能 需要 定期 重 哈 
希 以 增 大 桶 数 。 

e 了 哈 希 函数 的 详细 设计 是 精妙 的 ， 为 了 获得 最 优 的 性 能 需要 数学 分 析 。 虽 然 如 此 ， 任 
何 输出 非 负 整 数 的 哈 希 函数 都 可 以 产生 正确 的 结果 。 


复习 题 


1. 对 于 基于 矢量 的 映射 实现 ， 为 了 把 get 方法 的 时 间 降 低 到 O (log N)， 本 章 建议 用 什么 样 的 算法 
策略 ? 

2. 如 果 你 实现 了 前 面 问题 中 建议 的 策略 ， 为 什么 put 方法 仍然 需要 O (N) 的 时 间 ? 

3. 什么 是 查找 表 ? 查找 表 在 什么 情况 下 使 用 ? 

4. 使 用 键 的 首 字符 的 ASCH 码 值 作为 其 哈 希 码 有 何 缺 点 ? 

S. 在 哈 希 表 的 实现 中 ,术语 桶 是 什么 含义 ? 

6. 冲突 表示 什么 ? 

7. 在 图 15-7 中 ，stringmap .h 接口 的 私有 部 分 包括 拷贝 构造 函数 和 赋值 操作 符 的 定义 ,它们 使 得 
StringMap 对 象 不 能 复制 。 在 较 早 的 使 用 矢量 作为 底层 表示 的 stringmap.h 版 本 中 ， 这 些 定义 
是 不 存在 的 。 如 果 你 复制 一 个 基于 矢量 的 StringMap 会 发 生 什么 ? 

8. 图 15-8 显示 了 StringMap 的 哈 希 表 版 本 的 实现 ， 解 释 这 个 实现 中 findcell 方法 的 操作 。 

9. 本 书 中 提 及 的 字符 串 的 hashCode 函数 有 一 个 结构 类 似 于 随机 数 产生 器 。 如 果 照 搬 这 种 相似 性 ， 那 
么 你 会 倾向 于 编写 下 面 的 hash PRX: 
int hashCode(const string & str) { 

return randomInteger(0, HASH MASK); 
) 
为 什么 这 种 方法 不 行 呢 ? 

10. 如 果 你 提供 下 面 的 hashCode MA, HashMap 类 还 能 正确 运行 吗 ? 

int hashCode(const string & str) { 


return 42; 


) 


11. 在 跟踪 把 州 名 缩写 加 入 一 个 有 13 个 桶 的 映射 代码 时 ， 注 意 到 条 目 "AK" 和 "KS" 在 0 号 桶 发 生 冲 
突 。 假 设 新 的 条 目 按 州 名 缩写 的 字母 顺序 被 添加 ， 第 一 个 发 生 的 冲突 是 什么 ? 通过 查看 图 15-9 中 
的 图 表 你 应 该 能 够 清楚 答案 。 

12. 在 实现 哈 希 表 时 有 什么 样 的 时 空 权衡 ? i 

13. 术语 负荷 系数 是 什么 含义 ? 

14. 为 了 确保 HashMap 类 的 平均 时 间 性 能 为 O (1)， 负 荷 系数 合适 的 阔 值 是 什么 ? 

15. 术语 重 哈 希 表示 什么 含义 ? 

16. 每 种 键 类 型 必须 实现 什么 操作 ? 

17. 假设 你 想 要 使 用 第 6 章 的 Point 类 作为 HashMap 类 的 键 类 型 。 为 了 实现 必要 的 hashcode PR 
数 ， 本 章 提 供 了 什么 样 的 简单 策略 ? 
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习题 
1. 修改 图 15-3 中 的 代码 ， 以 便 put 方法 总 会 使 数组 中 的 键 保持 排序 顺序 。 改 变 私 有 方法 findKey 的 


2. 


3. 


实现 ， 使 用 二 分 查找 在 O (log N) 时 间 内 找到 其 键 值 。 

重 写 一 个 基于 矢量 的 StringMap 类 的 实现 ， 它 使 用 了 一 个 KeyValuePair 的 动态 数组 ， 从 而 保 
证 了 StringMap 类 不 再 依赖 于 Stanford 类 库 中 的 Vector 类 。 

从 前 面 习题 中 描述 的 基于 数组 的 StringMap 类 开始 ， 增 加 方法 size, isEmpty, containsKey 
和 clear 到 stringmap.h 接口 及 相应 的 实现 中 。 


4. 虽然 这 使 得 数学 运算 更 难 ， 但 罗马 人 使 用 不 同 的 字母 代表 S 和 10 的 倍数 。 用 来 编码 罗马 数字 的 字符 


iod 


ON 


own 


有 以 下 值 : 

I = l 
y oF 5 
X > 10 
> = 86 
C - 100 
D 一 500 
M - 1000 


设计 一 个 查找 表 ， 使 其 能 够 确定 每 个 字母 所 对 应 的 数值 。 使 用 这 个 表 实 现 一 个 函数 : 
int romanToDecimal (const string & str); 
它 把 一 个 包含 罗马 数字 的 字符 串 翻译 为 它 的 数字 形式 。 
为 了 计算 罗马 数字 的 值 ， 一般 把 每 个 字母 对 应 的 值 相 加 。 然 而 ， 这 个 规则 有 一 个 例外 : 如 果 字 
母 的 值 小 于 后 面 的 字母 值 ， 它 的 值 应 该 从 总 数 里 面 减 而 不 是 加 。 例 如 ， 罗 马 数字 串 McMLXIX 相 当 于 
1000 一 100 十 1000 十 50 十 10 一 1 十 10 


即 1969。 字 母 c 和 工 因 为 它们 之 后 的 字母 值 较 大 而 被 减 去 。 


.扩展 图 15-7 和 图 15-8 中 StringMap 类 的 实现 ， 使 得 桶 数 可 动态 扩展 。 你 的 实现 应 该 记录 哈 希 表 


的 负荷 系数 ， 并 且 在 负荷 系数 超过 阔 值 时 执行 重 哈 希 操作 ， 这 个 阔 值 用 以 下 定义 的 一 个 常数 表示 : 


static const double REHASH THRESHOLD = 0.7; 


.在 特定 的 应 用 中 , 扩展 HashMap 类 使 得 你 可 以 为 某 个 特定 的 键 插入 一 个 临时 值 ， 隐 藏 之 前 与 键 相 


关联 的 任何 值 。 在 程序 的 后 面 ， 你 可 以 删除 这 个 临时 值 ， 重 新 存储 接 下 来 最 近 的 那 一 个 键 - 值 对 。 
例如 ， 你 可 以 使 用 这 样 一 种 机 制 来 获得 局 部 变量 的 影响 ， 当 调用 函数 时 这 个 变量 值 存在 ， 当 函数 返 
回 时 该 值 消失 。 

通过 加 入 以 下 方法 实现 这 个 功能 : 


void add(const string & key, const string & value); 


该 方法 会 加 入 使 用 哈 希 表 存 储 条 目的 StringMap 类 的 实现 中 。 因 为 get 和 put 方法 总 能 找 
到 链表 中 的 第 一 个 条 目 ， 你 可 以 通过 在 链表 的 开始 处 为 特定 的 哈 希 桶 增加 新 条 目 ， 以 保证 add 
方法 隐藏 了 之 前 的 定义 。 此 外 ， 只 要 remove 的 实现 只 删除 了 在 哈 希 链 中 一 个 符号 的 第 一 次 
出 现 ， 你 可 以 使 用 remove 删除 最 近 的 新 插入 的 键 的 定义 ， 并 同时 将 它 后 继 的 定义 重新 存储 。 


.按照 15.4 节 中 描述 的 策略 实现 HashMap 类 ， 就 像 你 从 第 5 章 中 了 解 的 一 样 。 
. 为 每 个 基本 类 型 编写 hashCode PARK. 
.虽然 本 书 描述 的 桶 链 方 法 在 实际 中 工作 得 很 好 ,但 是 还 存在 其 他 的 策略 可 解决 哈 希 表 中 的 冲 


突 。 在 计算 的 早期 (内 存 很 小 ， 额 外 的 指针 必须 被 认真 对 待 )， 蛤 希 表 常常 使 用 一 种 更 节省 内 存 
的 被 称 为 开放 寻 址 (open addressing) 的 策略 ,其 中 的 键 - 值 对 被 直接 存储 在 数组 中 ， 如 下 图 
所 示 : 
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key 
array[0] i 
value 


key 
array[1] 
value 


key 
array [2] i 
value 


key 
array[3] i 
value 


key 
array [nBuckets-1] 
value 


例如 ， 如 果 一 个 键 被 哈 希 到 2 号 桶 中 ， 开 放 寻 址 策略 会 试 着 将 键 和 它 的 值 直 接 放 到 array [2] 中 的 
条 目 内 。 
687 采用 这 种 方法 的 问题 是 : array[3] 可 能 已 经 被 分 配给 其 他 哈 希 到 相同 桶 的 键 。 解 决 这 类 冲突 
最 简单 的 方法 就 是 把 每 一 个 新 的 键 存 放 在 第 一 个 自由 单元 或 在 它 期 望 的 哈 希 位 置 之 后 。 因 此 ， 如 果 
一 个 键 哈 希 到 2 SHH, put 和 get 方法 第 一 次 会 在 array [2] 中 找到 或 者 插入 这 个 键 。 如 果 该 位 
置 已 经 有 了 一 个 不 同 的 键 ， 那 么 这 些 函 数 就 会 继续 移 到 array[3] 处 ， 继 续 这 一 过 程 ， 直 到 找到 一 
个 空 的 位 置 或 者 一 个 匹配 的 键 。 正 如 第 14 章 中 环形 缓冲 队列 的 实现 ， 如 果 索 引 提前 指向 数组 的 末 
端 ， 它 会 绕 回 到 开始 处 。 这 个 解决 冲突 的 策略 叫做 线性 探测 (linear probing) 。 
重新 实现 StringMap 类 ， 使 用 具有 线性 探测 的 开放 寻 址 。 对 于 这 个 练习 ， 如 果 用 户 想 在 一 个 
满 的 哈 希 表 中 增加 一 个 键 ， 你 的 实现 应 该 显示 错误 。 
10. 扩展 你 对 习题 9 的 解决 方法 ， 使 得 无 论 何 时 负荷 系数 超过 常量 REHASH_THRESHOLD 时 ， 它 都 能 
动态 地 扩充 容易 ， 正 如 习题 5 中 所 定义 的 。 在 那个 练习 中 ， 你 需要 重建 条 目 表 ， 因 为 针对 键 的 桶 
688 数 在 你 给 nBuckets 赋 新 值 时 会 改变 。 
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Programming Abstractions in C++ 


树 


我 喜欢 树 ， 因 为 它们 比 其 他 事物 看 起 来 更 顺从 于 生活 。 
— —ikhk dx + MB, CM, HH! 》(O Pioneers!), 1913 


正如 前 几 章 所 述 ， 在 不 使 用 数组 的 情况 下 ， 链 表 可 用 来 表示 一 个 有 序 的 数据 集合 。 由 指 
针 链 接 起 来 的 每 个 单元 构成 线性 链表 ， 该 链表 定义 了 底层 的 顺序 。 尽 管 链 表 相 对 于 数组 要 求 
更 多 的 空间 ， 而 且 在 选取 指定 索引 位 置 的 值 时 显得 更 为 低 效 ， 但 是 它 的 优点 是 能 在 常量 时 间 
内 进行 插入 和 删除 操作 。 

在 数据 集合 中 ， 用 指针 来 定义 它们 的 关系 比 用 链表 所 带 来 的 优势 要 强大 得 多 ， 它 不 仅仅 
限制 于 建立 线性 结构 。 在 本 章 ， 你 将 学 习 一 种 使 用 指针 来 模拟 层次 关系 的 数据 结构 。 该 数据 
结构 被 称 为 树 (tree)， 它 被 定义 为 一 个 节点 (node) 的 集合 , 并 具有 以 下 性 质 : 

e 只 要 树 中 有 节点 ， 一 定 存在 着 一 个 特定 的 节点 ， 被 称 之 为 根 (root) 节点 ， 它 处 于 树 

的 最 顶层 。 

e 树 中 的 每 个 节点 与 根 节 点 只 有 唯一 的 一 条 通路 。 

树 结构 层次 也 出 现在 计算 机 科学 以 外 的 其 他 许多 领域 中 。 我 们 最 熟悉 的 一 个 实例 就 是 家 
谱 ， 将 在 下 一 节 讨 论 ， 其 他 的 示例 还 包括 : ; 

e 游戏 树 (game tree). 989 章 “ 最 小 最 大 算法 ”一 节 中 曾 提 到 过 的 分 支 模 式 是 一 种 很 

典型 的 树 。 当 前 位 置 是 树 的 根 ， 各 个 分 支 通 向 游戏 中 接 下 来 可 能 出 现 的 场景 。 

e 生物 分 类 (biological classification)。 生 物 的 分 类 系统 是 18 世纪 由 瑞典 的 植物 学 家 洛 

鲁 斯 ， 林 奈 发 明 的 一 种 树 状 结构 。 该 树 的 根 节点 是 所 有 生物 。 然 后 分 类 系统 的 不 同 
分 支 构建 起 了 各 自 的 王国 ， 最 常见 的 就 是 植物 和 动物 。 这 样 的 层次 继续 下 去 ， 直 到 
一 个 独立 的 物种 为 止 。 

e 组 织 图 (organizational chart)。 许 多 商业 团体 都 是 每 个 雇员 隶属 于 一 个 主管 ， 这 样 就 

建立 了 一 棵 树 ， 最 顶部 是 公司 的 总 裁 ， 代 表 根 节点 。 

e AREK (directory hierarchy)。 在 大 多 数 现 代 计 算 机 中 ,文件 存储 的 目录 构成 一 棵 

树 。 顶 部 的 目录 代表 根 节点 ， 它 包含 其 他 文件 和 目录 。 这 些 目录 又 有 自己 的 子 目录 ， 
以 此 构成 了 树 的 层次 结构 。 


16.1 家 谱 


家 谱 提供 了 一 种 便捷 的 方式 来 表示 从 单个 个 体 到 若干 代 血缘 关系 的 方法 。 例 如 ， 图 16-1 
表示 了 诺曼底 家 族 的 家 谱 ， 该 家 族 在 1066 年 的 哈 斯 丁 战役 后 统治 了 英国 。 该 图 的 结构 符合 
上 节 的 树 定义 。 威 廉 一 世 是 树 根 ， 其 他 人 都 以 唯一 的 下 降 路 径 连 接 到 威廉 一 世 。 


16.1.1 用 来 描述 树 的 术语 


图 16-1 的 家 谱 使 得 介绍 计算 机 科学 中 用 以 描述 树 结构 的 术语 变 得 简单 了 。 书 中 的 每 一 
个 节点 都 可 以 有 好 几 个 孩子 节点 (children node), 但 是 只 有 一 个 父 节点 (parent node)， 在 树 
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中 ， 祖 先 (ancestor) 和 子孙 (descendant) 的 含义 与 日 常 语 言 中 的 含义 完全 一 致 。 从 Henry I 
和 Matilda 的 下 降 路 线 表示 Henry IÆ William I 的 一 个 子孙 ， 反 过 来 讲 ，Henry IÆ Henry M 
的 一 个 祖先 。 类 似 地 ， 两 个 节点 如 果 共 享 一 个 共同 的 父 节 点 ， 例 如 Robert 和 Adela， 则 这 两 
个 节点 就 被 称 为 兄弟 (sibling). 

尽管 用 来 描述 树 的 大 部 分 术语 都 直接 来 自 于 家 谱 的 比拟 ,但 是 其 他 术语 (例如 根 ) 来 
自 于 植物 学 。 与 根 节点 相反 的 没有 孩子 节点 的 节点 被 称 为 叶子 节点 (leaf node)。 既 不 是 根 
节点 也 不 是 叶子 节点 的 节点 被 称 为 内 部 节点 (interior node)。 例 如 ， 在 图 16-1 P, Robert, 
William II, Stephen, William 和 Henry 了 [都 是 内 部 节点 。 一 个 非 空 树 从 根 节点 到 叶子 节点 
的 最 长 路 径 被 称 为 树 的 高 度 (height)。 因 此 ， 图 16-1 中 树 的 高 度 为 3， 因 为 从 William I 到 
Henry 开 的 路 径 长 于 其 他 任何 一 条 路 径 。 按 照 惯 例 ， 空 树 的 高 度 一 般 定 义 为 -1。 


William I 


Robert William II Adela Henry I 





Stephen William Matilda 


Henry Il 
图 16-1 诺曼底 家 族 


16.1.2 ” 树 的 递归 特性 

最 值得 注意 的 是 : 树 的 分 支 结构 也 适用 于 任意 层次 的 分 解 。 如 果 你 去 除 树 中 任意 一 个 节 
点 以 及 相应 的 子孙 ， 其 结果 仍然 满足 树 的 定义 。 例 如 ， 如 果 你 从 图 16-1 中 抽取 Henry | 及 其 
子孙 ， 那 么 得 到 以 下 的 树 : 


Henry I 
William Matilda 


Henry II 


从 树 中 取出 一 个 节点 及 其 子孙 所 构成 的 树 被 称 为 原来 树 的 子 树 ( subtree)。 例 如 ， 上 图 的 树 
就 是 以 Henry I 为 根 节点 的 一 棵 子 树 。 

树 中 的 每 个 节点 都 可 以 看 成 是 它 自 己 子 树 的 根 ， 这 就 强调 了 树 结构 的 递归 特性 。 如 果 你 
以 递归 的 视角 考察 树 ， 那 么 树 是 一 个 节点 和 一 个 其 附着 子 树 的 集合 一 一 当 为 叶子 节点 时 ， 该 
集合 为 空 。 树 的 递归 特性 是 其 底层 表示 和 大 部 分 针对 树 操作 的 算法 基础 。 


16.1.3 用 C++ 语言 表示 家 谱 


为 了 用 C++ 表示 一 棵 树 ， 需 要 以 某 种 方式 模拟 数值 之 间 的 层次 关系 。 在 大 多 数 情况 下 ， 
表示 父子 关系 最 简单 的 方式 就 是 在 父 方 包含 一 个 指向 子 方 的 指针 。 如 果 使 用 这 个 策略 ， 每 个 
节点 除了 存储 自己 的 数据 之 外 ， 还 需要 存储 指向 其 每 个 孩子 节点 的 指针 。 通 常 ， 将 节点 定义 
为 结构 ， 将 树 定义 为 指向 该 结构 的 一 个 指针 ， 就 能 很 好 地 实现 树 的 表示 。 这 种 树 的 定义 即使 
是 以 自然 语言 表述 也 是 递归 的 。 因 为 它们 拥有 如 下 关系 : 

o 树 是 指向 节点 的 指针 。 
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e 节点 是 包含 树 的 结构 。 
你 可 以 使 用 这 种 递归 思想 来 设计 一 个 适合 存储 如 图 16-1 所 示 家 谱 中 的 数据 结构 。 每 个 
节点 包含 一 个 人 名 以 及 指向 他 们 孩子 节点 指针 的 集合 。 如 果 将 孩子 指针 存储 在 一 个 矢量 中 ， 
那么 节点 的 结构 如 下 所 示 : 692 
struct FamilyTreeNode { 
string name; 


Vector«FamilyTreeNode *» children; 
}e 


一 棵 家 谱 树 简单 来 说 就 是 一 个 指向 这 些 节 点 的 指针 。 

图 16-2 展示 了 该 皇族 家 谱 的 内 部 实现 。 为 使 家 谱 图 整齐 有 序 ， 图 16-2 表示 的 孩子 节点 
看 起 来 像 是 一 个 五 元 数组 ; FXE, children 域 是 一 个 随 着 孩子 数量 增加 的 矢量 。 你 将 有 
机 会 寻找 其 他 策略 来 存储 孩子 节点 ,例如 在 本 章 结尾 的 习题 中 ， 可 以 使 用 链表 而 不 是 矢量 。 







William I 





William 
E m Loo] ka anl 


a 2L Cae lest 


BEEF ea 


图 16-2 诺曼底 家 族 的 基于 指针 的 树 表示 


16.2 二 又 搜 索 树 


尽管 可 以 使 用 家 谱 树 来 说 明 树 的 算法 ,但 在 简单 情境 下 进行 直接 编程 将 是 更 有 效 的 方 
法 。 虽 然 家 谱 树 的 例子 为 我 们 描述 树 的 术语 提供 了 一 个 框架 ， 但 是 每 个 节点 可 以 有 任意 数量 
的 孩子 节点 使 得 实际 实现 变 得 复杂 。 在 许多 情况 下 ， 限 制 孩子 节点 的 数目 使 得 树 更 易于 实现 [693 
是 很 合理 的 。 

树 的 一 棵 最 重要 的 ( 且 有 很 多 实际 应 用 的 ) 子 树 就 是 二 叉 树 (binary tree)， 它 是 一 棵 树 
并 具有 以 下 额外 特性 : 

e 树 中 每 个 节点 至 多 有 两 个 孩子 节点 。 

e 除了 根 节点 外 ， 每 个 节点 被 指定 为 要 么 是 父 节点 的 左 孩 子 (left child)， 要 么 是 父 节 

点 的 右 孩 子 (right child). 
上 述 第 二 个 条 件 强调 了 在 二 又 树 中 的 孩子 节点 相对 于 其 父 节点 而 言 是 有 序 的 。 例 如 以 下 二 
XB: 
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尽管 它们 包含 了 相同 的 节点 , 但 它们 是 两 棵 不 同 的 树 。 在 这 两 种 情况 下 ，B 节点 是 根 节 
点 A 的 孩子 节点 , 但 是 在 左边 的 树 中 ，B 是 左 孩子 节点 ， 而 在 右边 的 树 中 ， 它 是 右 孩 子 节 点 。 

事实 上 ， 在 二 又 树 中 的 节点 之 间 存 在 已 定义 的 几何 关系 ， 这 使 得 使 用 二 又 树 表 示 有 序 的 
数据 集合 变 得 更 加 方便 。 大 多 数 应 用 都 使 用 一 种 称 为 二 叉 搜 索 树 (binary search tree) 的 具有 
特殊 类 的 二 叉 树 。 该 树 一 般 缩 写成 BST， 它 具有 以 下 特性 : 

1. 每 个 节点 都 包含 (也 可 能 包含 其 他 的 数据 ) 一 个 特定 的 被 称 为 键 的 值 ， 它 定义 了 节点 
的 顺序 。 

2. 键 值 是 唯一 的 ， 也 就 是 说 任何 键 值 在 树 中 只 能 出 现 一 次 。 

3. 树 中 的 每 个 节点 ， 其 键 值 必须 大 于 以 它 左 孩子 节点 为 根 节 点 的 子 树 的 所 有 节点 的 键 
值 ， 一 定 小 于 以 它 右 孩子 节点 为 根 节点 的 子 树 的 所 有 节点 的 键 值 。 

尽管 该 定义 形式 上 是 正确 的 ， 但 是 一 开始 看 确实 很 令 人 困惑 。 弄 清楚 树 的 定义 和 理解 树 
满足 的 上 述 条 件 是 非常 有 用 的 ， 它 能 够 帮助 我 们 评判 关于 用 二 又 树 作为 解决 策略 的 典型 问题 。 


16.2.1 使 用 二 叉 搜 索 树 的 动机 


在 第 15 章 哈 希 算法 之 前 所 提出 的 表示 映射 的 一 个 策略 是 将 键 - 值 对 存放 在 一 个 矢量 中 。 
这 个 策略 有 一 个 有 用 的 计算 特性 : 如 果 你 保持 键 值 的 排列 顺序 ， 可 以 编写 一 个 运行 时 间 为 
O (log N) 的 get 函数 的 实现 。 你 所 要 做 的 就 是 采用 第 7 章 介绍 的 二 分 查找 算法 。 遗 憾 的 
是 ， 数 组 表示 无 法 编写 出 具有 相同 效率 的 put 函数 。 尽 管 put 方法 能 够 使 用 二 又 搜索 树 来 
决定 新 的 键 值 要 往 哪 里 插 ， 但 是 维护 所 存储 的 顺序 则 需要 O (N) 时 间 ， 因 为 数组 中 在 欲 插入 
新 值 元 素 位 置 后 的 每 一 个 后 续 元 素 都 必须 向 后 移动 以 为 新 元 素 提供 空间 。 

这 个 问题 使 我 们 想起 第 13 章 中 的 一 个 类 似 情景 。 当 使 用 数组 表示 编辑 器 缓冲 区 时 ， 插 
入 一 个 新 字符 为 线性 时 间 操 作 。 在 那个 示例 中 ， 解 决 方案 是 采用 链表 代替 数组 。 那 么 在 映射 
中 可 以 采用 相似 的 策略 来 改进 put 方法 的 性 能 吗 ? 毕竟 ， 只 要 你 有 一 个 指向 插入 点 的 前 一 
个 元 素 的 指针 ， 在 链表 中 插入 一 个 新 元 素 就 是 一 个 常量 时 间 的 操作 。 

用 链表 表示 的 问题 在 于 它们 不 支持 任何 有 效 的 二 分 查找 算法 。 二 分 查找 依赖 于 能 以 常量 
时 间 找 到 元 素 集合 中 的 中 间 元 素 。 在 一 个 数组 中 ， 找 中 间 值 很 简单 。 在 链表 中 找 中 值 唯一 的 
方法 是 遍历 链表 前 半 部 分 所 有 的 链接 指针 。 

为 了 更 具体 地 理解 链表 的 这 些 限 制 ， 假 设 有 一 个 包含 沃 特 . 迪斯尼 的 七 个 矮人 名 的 
链表 : 


le Bashful— Doc—> Dopey — Grumpy — Happy — Sleepy > Sneezy 


该 链表 中 的 元 素 以 字典 顺序 排序 ， 即 按照 内 部 字符 码 排列 的 顺序 。 

给 定 一 个 这 种 排序 的 链表 ， 可 以 很 容易 地 找到 其 中 的 第 一 个 元 素 ， 因 为 内 部 指针 给 出 了 
它 的 地 址 。 然 后 ， 你 可 以 顺 着 链接 指针 找到 第 二 个 元 素 。 另 一 方面 ， 没 有 方便 的 方法 可 定位 
序列 的 中 间 元 素 。 为 此 ， 不 得 不 遍历 链表 中 的 每 个 指针 ， 直 到 计数 N/2 处 为 止 。 在 链表 中 
找 中 值 的 操作 需要 线性 时 间 ， 它 会 完全 抵消 二 分 查找 的 效率 优势 。 如 果 二 分 查找 旨 在 改进 效 
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率 ， 那 么 该 数据 结构 必须 能 够 快速 找到 中 间 元 素 。 
尽管 这 样 做 第 一 眼看 起 来 很 傻 , 但 是 想象 如 果 简 单 地 将 指针 指向 链表 中 间 而 不 是 开头 将 
会 发 生 什么 是 很 有 用 的 : 


Bashful — Doc — Dopey — Grumpy —> Happy — Sleepy — Sneezy 


在 这 个 图 中 ， 你 能 很 容易 找到 中 间 元 素 。 通 过 链表 指针 可 以 立即 找到 这 个 链表 中 的 中 间 
元 素 。 然 而 ,问题 是 你 已 经 将 链表 一 半 的 元 素 丢 掉 了 。 该 结构 中 的 指针 提供 了 访问 矮人 
Grumpy 及 上 其 之 后 的 所 有 的 名 字 的 方法 ,但 是 却 不 能 再 访问 Bashful、Doc 和 Dopey J. 

如 果 你 站 在 Grumpy 的 角度 来 思考 ,一 个 一 般 的 问题 解决 方案 就 变 得 清晰 起 来 。 你 需 
要 从 Grumpy 节点 散射 出 两 个 链表 : 一 个 链表 包含 Grumpy 前 面 的 元 素 ， 另 一 个 链表 则 包 
A Grumpy 后 面 的 元 素 。 在 概念 图 中 ， 你 所 要 做 的 就 是 翻转 箭头 : 


Bashful 4+ Doc ¢- Dopey ¢ Grumpy — Happy — Sleepy — Sneezy 


现在 链表 中 的 每 个 字符 串 都 能 访问 ， 你 可 以 很 容易 地 把 整个 链表 一 分 为 二 。 
此 时 ， 你 需要 递归 地 应 用 此 策略 。 二 分 查找 算法 不 仅仅 需要 你 找 出 原 链 表 的 中 间 元 素 ， 
还 有 子 链表 的 中 间 元 素 。 因 此 ， 你 需要 使 用 相同 的 分 解 策略 重 构 Grumpy 前 面 和 后 面 的 链 
表 。 每 一 个 元 素 都 指向 两 个 方向 : 指向 前 面 链表 的 中 间 点 和 后 面 链 表 的 中 间 点 。 应 用 此 过 程 
将 原 链 表 转 化 成 以 下 的 二 又 树 : 
ncc MED 
人 


Doc Sleepy 


Bashful Dopey Happy Sneezy 


这 种 特定 风格 的 二 叉 树 的 一 个 最 重要 的 特点 是 元 素 为 有 序 的 。 对 于 树 中 任何 特定 节点 ， 
它 所 包含 的 字符 串 必须 在 其 左 子 树 中 所 有 元 素 的 后 面 ， 而 在 其 右 子 树 中 所 有 元 素 的 前 面 。 
在 该 例 中 ，Grumpy 跟 在 Doc、Bashful Ñ Dopey 的 后 面 ， 但 却 在 Sleepy、Happy 和 
Sneezy 的 前 面 。 同 样 的 规则 应 用 到 树 中 的 各 个 层次 ， 因 此 包含 Doc 的 节点 在 Bashful 节 
点 的 后 面 ， 而 在 Dopey 节点 的 前 面 。 在 前 面 小 节 结尾 的 关于 二 又 搜索 树 的 正式 定义 保证 了 
树 中 的 每 个 节点 都 遵循 有 序 原则 。 


16.2.2 ”在 二 义 搜索 树 中 寻找 节点 


二 叉 搜 索 树 一 个 最 基本 的 优点 就 是 你 可 以 使 用 二 分 查找 算法 来 寻找 一 个 特定 的 节点 。 例 
如 ， 假 如 你 要 在 前 面 一 节 最 后 的 树 中 寻找 包含 字符 串 Happy 的 节点 。 第 一 步 是 将 Happy 
和 树 根 节点 Grumpy 作 比 较 。 在 字典 中 ，Happy 位 于 Grumpy 之 后 ， 所 以 你 应 该 清楚 : 如 
果树 中 字符 串 Happy 存在 ， 那 么 一 定 在 Grumpy 的 右 子 树 中 。 接 下 来 ， 就 比较 Happy 和 
Sleepy。 在 这 种 情况 下 ，Happy Æ Sleepy 前 面 ， 因 此 它 必定 在 Sleepy 的 左 子 树 中 。 
该 子 树 只 有 一 个 节点 ， 它 正好 就 是 我 们 要 找 的 。 

因为 树 是 一 种 递归 结构 ， 所 以 很 容易 以 递归 的 形式 编写 搜索 算法 。 为 了 具体 说 明 ， 让 我 
们 假设 BSTNode 的 类 型 定义 如 下 : 


468 #16 F 





struct BSTNode { 
string key; 
BSTNode *left, *right; 
pz 
给 定 此 定义 ， 很 容易 编写 出 以 下 findNode 函数 来 实现 二 分 查找 算法 : 
BSTNode *findNode(BSTNode *t, const string & key) ( 
if (t == NULL) return NULL; 
if (key == t->key) return t; 
if (key < t->key) { 
return findNode(t->left, key); 
) else { 
return findNode(t->right, key); 
) 
) 
如 果树 为 空 ， 所 求 节点 必然 不 在 树 中 ，findNode 函数 就 会 返回 NULL， 表 示 找 不 到 该 关键 
字 。 如 果树 不 为 空 ， 函 数 会 检验 所 求 节点 与 当前 节点 是 否 匹 配 。 如 果 匹 配 ，findNode 函数 
返回 指向 当前 节点 的 指针 。 如 果 不 匹 配 ，findNode 函数 就 向 前 递归 ， 至 于 是 向 左 子 树 还 
是 向 右 子 树 中 寻找 ， 取 决 于 键 值 比较 的 结果 。 


16.2.3 ”在 二 又 搜索 树 中 插入 一 个 新 节点 


接 下 来 首先 要 考虑 的 问题 是 如 何 建立 一 个 二 叉 搜索 树 。 最 简单 的 方法 是 以 空 树 开 始 ， 然 
后 调用 insertNode 函数 来 向 树 中 每 次 插 和 人 一 个 新 的 键 值 。 当 所 有 新 的 键 值 被 插入 后 ， 维 
持 树 中 节点 的 有 序 关 系 很 重要 。 为 了 确保 findNode 函数 继续 工作 ，insertNode RUV 
须 使 用 二 又 搜 索 树 来 甄别 正确 的 插入 点 。 

结合 findNode, insertNode 函数 可 以 从 树 根 开始 递归 向 前 插入 节点 。 在 每 个 节点 
E, insertNode 必须 将 新 的 键 值 与 当前 键 值 进行 比较 。 如 果 新 键 值 小 于 当前 键 值 ， 则 将 
新 键 值 插 和 人 到 其 左 子 树 中 。 相 反 ， 如 果 新 键 值 大 于 当前 键 值 ， 就 将 其 插入 到 右 子 树 中 。 最 
后 ,程序 会 遇 到 一 个 空子 树 ， 代 表 树 中 需要 插入 新 节点 的 地 方 。 在 该 点 上 ，insertNode 
函数 用 包含 了 那个 键 值 的 已 初始 化 的 新 节点 代替 NULL 指针 。 

然而 ，insertNode 函数 的 代码 有 点 复杂 。 其 难点 是 insertNode 必须 能 够 通过 增加 
一 个 新 键 值 来 改变 二 又 搜索 树 的 键 值 。 既 然 insertNode 函数 需要 改变 参数 值 ， 因 此 必须 
采用 引用 方式 传递 参数 ， 而 不 能 像 findNode 函数 那样 取 BSTNode * 类 型 的 参数 。 因 此 ， 
insertNode 函数 的 原型 如 下 所 示 : 


void insertNode(BSTNode * & t, const string & key); 
一 旦 你 理解 了 insertNode 函数 的 原型 ， 编 写 它 就 不 会 太 困 难 。 函 数 实现 如 下 所 示 : 


void insertNode(BSTNode * & t, const string & key) 
if (t == NULL) ( 
t = new BSTNode; 
t->key = key; 
t->left = t->right = NULL; 
} else { 
if (key != t->key) { 
if (key < t->key) { 
insertNode(t->left, key); 
) eise ( 
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insertNode(t-»right, key) ; 
} 
} 

} 
WR t A NULL, W insertNode 函数 创建 一 个 新 节点 ， 并 初始 化 其 数据 域 ， 然 后 用 一 个 
指向 新 节点 的 指针 代替 当前 节点 的 NULL BET. WR c AA NULL, insertNode 函数 会 使 
用 树 t 的 根 节点 的 键 值 与 新 键 值 比较 。 如 果 匹 配 ,说 明 该 键 值 已 在 树 中 ， 不 需要 进行 比较 操 
作 了 。 如 果 不 匹 配 ，insertNode 使 用 比较 结果 来 决定 是 插入 到 左 子 树 还 是 右 子 树 ， 然 后 
执行 相应 的 递归 调用 。 

因为 insertNode 的 代码 看 起 来 有 点 复杂 ， 所 以 跟踪 插入 几 个 键 值 的 过 程 细节 很 有 必 
要 。 例 如 ， 假 如 你 已 经 声明 并 初始 化 了 一 棵 空 树 ， 如 下 所 示 : 


BSTNode *dwarfTree - NULL; 


该 语句 在 包含 该 声明 的 函数 的 栈 帧 中 创建 了 一 个 局 部 变量 dwarfTree， 如 下 图 所 示 : 
HE B 





dwarfTree 


如 果 你 调用 以 下 语句 ， 会 发 生 什么 : 
insertNode (dwarfTree, "Grumpy"); 


如 果 dwarfTree 为 空 指针 ， 会 出 现 什么 情况 ? 在 insertNode 的 栈 帧 中 ， 引 用 变量 七 是 
指向 变量 dwarfTree 的 指针 。 因 此 该 调用 开始 的 栈 帧 如 下 图 所 示 : 





代码 首先 检查 七 是否 为 NULL， 此 时 符合 该 情况 。 程 序 继续 以 下 行 语句 开始 的 并 带 有 if 语 
句 函 数 体 执行 : 


t = new BSTNode; 


该 行 代码 在 堆 存 储 区 给 新 节点 分 配 内 存 ， 并 且 将 其 赋值 给 引用 参数 上， 因此 指针 单元 发 生 改 
变 ， 如 下 图 所 示 : 


dwarfTree 





接 下 来 的 语句 将 键 值 Grumpy 复制 到 新 节点 的 域 中 ， 并 且 将 每 一 个 子 树 的 指针 初始 化 为 空 
指针 。 当 insertNode 函数 返回 时 ， 树 的 状态 如 下 图 所 示 : 
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dwarfTree 


该 结构 正确 地 表示 了 包含 单个 节点 Grumpy 的 二 又 搜 索 树 。 
如 果 再 使 用 insertNode 向 树 中 插入 sleepy 将 会 怎样 呢 ? 和 之 前 一 样 ， 初 始 调用 会 
产生 一 个 栈 帧 ， 其 中 引用 参数 指向 dwarfTree: 


dwarfTree 


然而 ， 这 次 树 t 的 值 不 再 为 NULL， 因 为 dwarfTree 变量 现在 已 经 包含 了 Grumpy 节点 的 
地 址 。 在 字典 中 ，Sleepy 在 Grumpy 的 后 面 ， 故 insertNode 函数 继续 如 下 递归 调用 : 


insertNode(t-»right, key); 


此 时 ,递归 调用 看 起 来 像 是 在 给 原来 空 树 插入 Grumpy 一 样 。 唯 一 的 不 同 是 引用 参数 上 
现在 指向 一 个 已 经 存在 的 节点 ， 如 下 图 所 示 : 





dwarfTree 
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其 他 对 insertNode 的 调用 又 会 创建 新 的 节点 ， 并 且 将 它们 以 二 又 搜索 树 要 求 的 顺序 插 
入 到 该 树 结构 中 。 例 如 ， 如 果 将 剩 下 的 其 他 五 个 小 矮人 按照 Doc、Bashful、Dopey、 
Happy 和 Sneezy 的 顺序 插入 ， 最 后 得 到 的 二 又 搜索 树 如 图 16-3 所 示 。 







| 
| 






图 16-3 包含 七 个 小 矮人 的 二 叉 搜 索 树 的 结构 图 


16.2.4 删除 节点 

从 二 又 搜 索 树 中 删除 节点 比 插 人 一 个 节点 要 更 复杂 一 些 。 找 出 要 被 删除 的 节点 比较 简 
单 。 你 只 需 采 用 同样 的 二 分 查找 策略 来 定位 一 个 特定 键 所 在 的 位 置 。 一 旦 找到 匹配 的 节点 ， 
就 必须 在 不 违反 二 叉 搜索 树 顺序 关系 的 前 提 下 从 树 中 将 其 删除 。 由 于 删除 节点 取决 于 该 节点 
在 树 中 的 位 置 ， 所 以 难度 很 大 。 

为 了 理解 这 个 问题 ， 假 设 你 在 处 理 包含 下 面 七 个 小 矮人 名 字 的 二 又 搜索 树 : 


Grumpy 
Doc Sleepy 


Bashful Dopey Happy Sneezy 


删除 Sneezy (大 概 是 创建 了 一 种 不 好 的 工作 环境 ) 是 容易 的 。 你 需要 用 一 个 NULL 指针 代 
替 指 向 Sneezy 的 指针 ， 这 就 形成 了 下 面 的 树 : 


Doc Sleepy 


Bashful Dopey Happy 


从 此 开始 ， 删 除 Sleepy 也 相对 容易 一 些 。 如 果 你 想 删 除 的 节点 的 某 个 孩子 节点 为 空 ， 你 
所 要 做 的 就 是 用 非 空 的 那个 子 节点 来 替换 它 ， 如 下 图 所 示 : 


e 
Doc Happy 


Bashful Dopey 
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然而 ， 如 果 你 尝试 删除 既 有 左 孩 子 节点 又 有 右 孩 子 节点 的 节点 ， 就 会 出 现 一 个 问题 。 例 
如 ， 假 如 你 想 从 包含 所 有 的 七 个 小 矮人 的 原始 树 中 删除 Grumpy (为 了 避免 错误 )。 如 果 简 
单 地 将 其 移 除 ， 就 会 形成 两 部 分 查找 树 ， 一 个 以 Doc 为 根 节点 ， 一 个 则 以 Sleepy HRI 
点 ， 如 下 图 所 示 : 


3 


Doc Sleepy 


Bashful Dopey Happy Sneezy 


此 时 ,你 想 做 的 可 能 就 是 找 一 个 节点 来 插入 移 除 Grumpy 节点 留 下 的 空间 。 为 了 确保 
删除 结果 也 是 一 个 二 叉 搜 索 树 ， 只 有 两 个 节点 可 以 使 用 : 左 子 树 最 右边 的 节点 或 右 子 树 最 
左边 的 节点 。 这 两 个 节点 作用 等 价 。 例 如 ， 如 果 你 选择 了 左 子 树 最 右边 的 节点 ， 即 Dopey 
节点 ， 该 节点 键 值 大 于 左 子 树 其 他 键 值 ， 小 于 右 子 树 所 有 键 值 。 为 了 完成 删除 ， 你 需要 以 
Dopey 的 左 孩 子 节点 来 代替 Dopey， 当 然 ， 可 能 像 示 例 中 是 个 空 指针 。 然 后 将 Dopey 移 到 
删除 的 节点 上 。 最 终结 果 如 下 图 所 示 : 


Doc Sleepy 


Bashful Happy Sneezy 


16.2.5 ” 树 的 遍历 


二 叉 搜 索 树 的 结构 使 得 遍历 按键 值 顺 序 排列 的 节点 变 得 很 容易 。 例 如 , ' 你 可 以 使 用 如 下 
方法 以 字典 顺序 展示 二 又 搜 索 树 的 键 值 : 


void displayTree(BSTNode *t) ( 
if (t != NULL) { 
displayTree(t-»left); 
cout << t->key << endl; 
displayTree (t->right) ; 
} 
} 


因此 ， 如 果 调 用 displayTree 处 理 图 16-3 所 示 的 树 ， 你 将 会 得 到 以 下 输出 : 
(600 .. Dwaffee n - 
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在 每 个 递归 层次 上 ，displayTree 都 会 检查 树 是 否 为 空 。 如 果 为 空 ， 则 不 再 执行 。 否 则 ， 
递归 调用 的 顺序 确保 了 以 正确 的 顺序 输出 结果 。 第 一 次 递归 调用 显示 当前 节点 前 的 键 值 ， 它 
们 都 必须 出 现在 左 子 树 中 。 因 此 ， 在 当前 节点 前 显示 左 子 树 的 键 值 ， 就 维持 了 正确 的 显示 顺 
序 。 类 似 地 ， 在 执行 最 后 一 个 调用 前 显示 当前 节点 的 键 值 就 非常 重要 ， 该 递归 调用 将 显示 在 
ASCII 序列 中 靠 后 出 现 并 因此 出 现在 右 子 树 中 的 键 值 。 
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遍历 树 中 的 节点 ， 并 且 在 每 个 节点 上 进行 某 种 操作 的 过 程 被 称 为 树 的 遍历 ( traversing / 
walking the tree)。 在 很 多 情况 下 ， 你 总 是 想 以 键 的 顺序 遍历 一 棵 树 ， 正 如 在 displayTree 
中 示例 的 那样 。 该 方法 是 首先 处 理 当 前 节点 的 左 子 树 ， 然 后 是 该 节点 ， 之 后 是 该 节点 的 右 
子 树 的 一 个 递归 调用 过 程 ， 这 种 遍历 称 为 中 序 遍 历 (inorder traversal)。 然 而 ， 在 下 文中 
还 有 其 他 两 种 类 型 的 树 的 遍历 方式 ， 分 别 被 称 为 先 序 遍历 (preorder traversal) 和 后 序 遍 历 
(postorder traversal) 。 在 先 序 遍历 中 ， 当 前 节点 在 它 的 两 个 子 树 前 处 理 ， 如 以 下 代码 所 示 : 704 
void preorderTraversal(BSTNode *t) { 
if (t != NULL) ( 
cout << t->key << endl; 
preorderTraversal (t->left) ; 
preorderTraversal (t->right) ; 


} 
} 


假定 有 图 16-3 所 示 的 树 ， 在 以 下 示例 输出 中 ， 先 序 遍 历 输出 各 节点 : 
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在 后 序 饥 历 中 ， 先 处 理 左右 子 树 ， 然 后 处 理 当前 节点 。 后 序 遍 历 的 代码 如 下 所 示 : 


void postorderTraversal(BSTNode *t) ( 
if (t != NULL) ( 
postorderTraversal (t->left) ; 
postorderTraversal (t->right) ; 
cout << t->key << endl; 
} 
} 


用 包含 七 个 小 矮人 的 二 又 搜 索 树 执行 上 述 函 数 ， 得 到 以 下 结果 : 





16.3 平衡 树 

尽管 实现 insertNode 用 到 的 递归 策略 保证 了 将 节点 组 织 为 一 棵 合法 的 二 又 搜索 树 ， 
但 是 树 的 结构 取决 于 节点 要 插入 的 位 置 。 例 如 图 16-3 的 树 ， 由 按 以 下 顺序 插入 的 名 字 序 列 
产生 : 

Grumpy. Sleepy. Doc. Bashful, Dopey. Happy. Sneezy 


假设 你 按照 字母 表 顺 序 输入 上 述 这 些 名 字 。 那 么 第 一 次 调用 insertNode 时 会 在 根 节点 插 
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A Bashful», Æ H insertNode 调用 会 在 Bashful 之 后 插入 Doc, 在 Doc 之 后 插入 
Dopey， 以 此 类 推 。 上 述 每 个 新 插入 的 节点 都 附加 在 先前 节点 的 右 子 树 上 。 

最 后 所 形成 的 图 16-4 的 树 看 起 来 更 像 是 一 个 链表 。 无 论 如 何 ， 图 16-4 的 树 保持 着 这 样 
一 个 特性 : 任何 节点 的 键 值 都 大 于 其 左 子 树 的 所 有 节点 的 键 值 ， 而 小 于 其 右 子 树 的 所 有 节 
点 的 键 值 。 因 此 它 符合 二 又 搜索 树 的 定义 ， 使 得 函数 £indNode 将 会 被 正确 调用 。 然 而 ， 
findNode 函数 算法 的 运行 时 间 与 树 的 高 度 成 正比 ， 这 也 就 意味 着 树 的 结构 对 算法 行为 有 
很 大 影响 。 如 果 一 个 二 又 搜索 树 如 图 16-3 所 示 ， 那 么 在 树 中 找 出 键 值 的 时 间 为 O (log N)。 
另 一 方面 ， 如 果树 如 图 16-4 所 示 ， 运 行 时 间 将 会 恶化 为 O(N). 
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图 16-4” 非 平衡 的 二 又 搜 索 树 


只 有 当 左 子 树 和 右 子 树 大 体 上 高 度 相 同时 ， 用 以 实现 findNode 函数 的 二 又 搜 索 
算法 才 会 达到 理想 的 性 能 。 具 有 上 述 特性 的 树 ， 即 如 图 16-3 所 示 的 树 ， 被 称 为 是 平衡 的 
( balanced)。 更 正式 地 讲 ， 如 果 对 于 树 中 的 每 一 个 节点 ， 其 左 子 树 和 右 子 树 的 高 度 相 差 不 超 
过 1， 那么 一 个 二 又 树 被 定义 为 平衡 树 。 为 了 说 明 平 衡 二 又 树 的 定义 ,图 16-5 所 示 的 上 面 
一 行 的 各 棵 树 均 为 具有 7 个 节点 的 平衡 树 ， 而 下 面 一 行 的 各 个 树 均 为 非 平衡 树 。 在 上 述 各 棵 
树 中 ， 不 满足 平衡 树 定义 的 节点 用 空心 圆 表 示 。 例 如 ， 在 非 平衡 树 最 左边 的 那 棵 树 中 ， 其 根 
节点 的 左 子 树 高 度 为 2， 而 右 子 树 高 度 为 0。 在 男 外 两 个 非 平衡 树 中 ， 由 于 根 节点 有 不 平衡 
的 孩子 节点 ， 故 它们 也 是 不 平衡 的 。 

在 图 16-5 中 的 第 一 棵 树 是 一 棵 最 佳 的 平衡 二 叉 树 ， 因 为 树 中 每 个 节点 左右 子 树 的 高 度 
都 相等 。 然 而 ， 只 有 当 树 中 节点 数 等 于 2-1 时 ， 才 有 可 能 产生 这 种 最 佳 平衡 二 又 树 。 如 果 
树 中 的 节点 数 不 满 足 上 述 条 件 ， 则 树 中 肯定 会 出 现 某 些 节点 的 左右 子 树 的 高 度 不 同 的 情况 。 
由 于 平衡 二 叉 树 允许 节点 左右 子 树 的 高 度 可 相差 1， 因 此 ， 在 不 影响 计算 性 能 的 情况 下 , OF 
衡 二 叉 树 在 树 的 结构 上 提供 了 某 种 灵活 性 。 


16.3.1 平衡 树 策 略 


只 有 避免 与 非 平衡 树 相 关 的 最 差 情 况 出 现 ， 二 又 搜索 树 在 实际 应 用 中 才 有 用 。 当 树 不 
平衡 时 ，findNode 和 insertNode 操作 的 运行 时 间 就 会 变 为 线性 。 如 果 二 又 树 的 运行 时 
间 恶 化 到 O(N)， 你 最 好 使 用 一 个 有 序数 组 来 存储 节点 。 有 序数 组 需要 O (log N) 时 间 实 现 
findNode, O(N) 时 间 实 现 insertNode。 从 计算 角度 来 看 ， 一 个 基于 数组 的 表示 更 有 可 
能 优 于 基于 平衡 树 的 表示 ， 而 且 数 组 表示 更 易于 编码 。 

二 叉 搜索 树 之 所 以 能 作为 一 种 有 用 的 编程 工具 ， 其 原因 在 于 你 可 以 在 建树 的 时 候 保持 其 
平衡 。 它 的 基本 思想 就 是 扩展 insertNode 的 实现 ， 使 之 在 插 和 人 新 节点 时 追踪 检查 树 是 否 
平衡 。 一 旦 树 不 平衡 ，insertNode 在 不 打 乱 二 叉 搜索 树 顺序 的 情况 下 ， 必 须 重新 分 布 树 





平衡 树 : 


非 平衡 树 : 


图 16-5 平衡 和 非 平 衡 二 又 树 的 示例 


中 的 节点 使 之 保持 平衡 。 假 设 可 以 重新 分 布 树 中 节点 的 时 间 与 树 的 高 度 使 之 成 正比 ， 则 
findNode 5 insertNode 可 以 在 O (log N) 时 间 内 实现 。 

维持 二 叉 搜 索 树 平衡 的 算法 在 计算 机 科学 领域 已 得 到 深入 研究 。 现 在 所 使 用 的 实现 
平衡 二 叉 树 的 算法 都 是 计算 机 科学 领域 广泛 的 理论 研究 结果 。 然 而 ， 其 中 的 大 多 数 算 
法 ， 如 果 不 复 习 已 超出 了 本 书 范围 的 相关 数学 基础 是 很 难 解释 清楚 的 。 为 了 说 明 这 些 算法 
确实 可 行 ， 我们 在 接 下 来 几 节 中 将 展示 第 一 代 平衡 树 算法 ， 它 由 俄国 数学 家 乔 吉 ， 安 德 
$k - 维 斯 基 ( Georgii Adelson-Velskii) 和 艾 维 基尼 * 兰 带 斯 ( Evgenii Landis) 于 1962 
年 提出 ， 被 称 为 AVL ( 取 两 人 名 字 的 首 字母 ) 算法 。 尽 管 AVL 算法 已 在 很 大 程度 上 被 
现代 算法 所 取代 ,但 是 它 比 现代 算法 更 容易 解释 。 而 且 ， 由 于 用 于 实现 AVL 算法 操作 
的 基本 策略 也 用 于 其 他 的 算法 中 ， 因 此 ， 这 使 得 AVL 算法 仍 是 很 多 现代 技术 的 一 个 很 好 
模型 。 


16.3.2 可视化 AVL 算法 


在 你 试图 理解 AVL 算法 的 实现 细节 之 前 ， 回 顾 一 下 向 二 叉 搜 索 树 中 插入 节点 的 过 程 ， 
并 看 一 下 会 出 现 什么 错误 ， 如 果 可 能 的 话 ， 请 再 想象 一 下 你 将 要 如 何 处 理 所 出 现 的 问题 。 让 
我 们 想象 一 下 : 你 要 创建 一 个 包含 化 学 元 素 符号 的 二 又 搜索 树 。 例 如 ， 树 中 的 前 六 个 元 
素 是 : 

H (A) 

He (4) 

Li (4) 

Be (4) 

B (Hu) 

C (9X) 

如 果 你 以 默认 顺序 ( 即 以 这 些 元 素 在 周期 表 上 的 顺序 ) 插入 这 些 元 素 符号 ， 会 出 现 什么 
情况 呢 ? 因 为 树 初始 为 空 ， 所 以 插入 第 一 个 元 素 很 简单 ， 即 创建 了 一 个 仅 包含 符号 H 的 根 节 
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上 点。 如果 调用 insertNode， 由 于 He LACE SEHE HETE H Za, PRUE KAS WAZ. 
因此 ， 树 中 的 头 两 个 节点 的 分 布 如 下 图 所 示 : 


为 了 追踪 树 是 否 平衡 ，AVL 算法 给 树 中 的 每 个 节点 关联 一 个 表示 其 右 子 树 与 其 左 子 树 
高 度 之 差 的 整数 值 ， 它 被 称 为 该 节点 的 平衡 因子 (balance factor)。 在 上 述 包 含 前 两 个 元 素 
符号 的 简单 树 中 ,平衡 因子 显示 在 每 个 节点 的 右上 角 ， 如 下 图 所 示 : 


到 目前 为 止 ， 该 树 是 平衡 的 ， 因 为 没有 任何 节点 的 平衡 因子 的 绝对 值 大 于 1。 然 而， 当 
你 加 入 下 一 个 元 素 时 ， 情 况 发 生 了 变化 。 如 果 你 遵循 标准 插入 算法 ,插入 Li 元 素 后 树 的 布 
局 如 下 图 所 示 : 


JE, 根 节 点 不 再 平衡 ， 因 为 它 的 右 子 树 高 度 为 1， 左 子 树 高 度 为 -1 (由 定义 知 )， 两 者 之 
差 大 于 1。 
为 了 消除 不 平衡 ， 你 需要 重 构 这 棵 树 。 对 于 此 给 定 的 节点 集 ， 只 有 一 种 平衡 状态 使 得 节 


点 具有 正确 的 相对 顺序 。 该 树 以 He WHR, KA Li 分 别 是 它 的 左右 子 树 ， 如 下 图 所 示 : 
| eN 
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该 树 再 一 次 达到 平衡 ， 但 是 还 有 一 个 重要 的 问题 ， 如 何 知道 为 了 重新 得 到 一 棵 平衡 树 要 执行 
哪些 操作 呢 ? 


16.3.8 单 旋转 


AVL 策略 的 基本 思想 是 : 你 总 是 能 够 通过 一 次 简单 的 节点 重 排 来 使 树 达 到 平衡 。 想 象 
一 下 破除 此 树 中 不 平衡 所 需 的 步 又 ， 显 然 ， 将 He 节点 向 上 移 使 其 成 为 树 根 ， 而 将 HIS PEE 
使 其 成 为 He 的 孩子 。 在 某 种 程度 上 ， 上 述 转换 具有 将 节点 日 和 He 向 左旋 转 的 特点 ， 如 下 
图 所 示 : 
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在 旋转 操作 中 涉及 的 两 个 节点 被 称 为 一 次 旋转 的 轴 (axis). EUA H, He 和 Li 三 个 元 
素 的 示例 中 ,旋转 是 绕 着 H-He 轴 进 行 的 。 由 于 该 操作 向 左 移动 节点 ， 因 此 图 中 所 示 的 操作 
被 称 为 左旋 转 (left rotation)。 如 果树 在 相反 的 方向 上 失去 平衡 ， 那么 可 以 使 用 对 称 的 右 旋 
转 (right rotation) 操作 ， 它 只 是 简单 地 将 左旋 转 进行 反 向 操作 。 例 如 ， 接 下 来 的 两 个 元 素 符 
号 Be 和 B， 每 一 个 都 加 在 树 的 左边 。 为 了 使 树 重新 平衡 ， 需 要 绕 着 Be-H 轴 执 行 一 次 右 旋 
转 ， 如 下 图 所 示 





BC 


遗憾 的 是 ， 简 单 地 旋转 操作 并 不 总 能 保证 树 平衡 。 例 如 ， 考 虑 将 Cc 加 入 树 中 会 出 现 什么 
情况 。 在 执行 任何 平衡 操作 之 前 ， 树 的 状态 如 下 图 所 示 : 
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根 节点 He 是 不 平衡 的 。 如 果 你 尝试 通过 绕 Be-He 轴 向 右 旋转 树 来 获得 平衡 ， 那 么 将 得 到 
如 下 图 所 示 的 树 状态 : 
NEN 
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旋转 之 后 ， 树 依然 不 平衡 。 它 和 上 图 唯一 的 不 同 在 于 : 此 时 ， 根 节点 在 其 右 子 树 上 不 平衡 。 


16.3.4 Mitt 


在 上 述 最 后 的 示例 中 ， 出 现 问 题 的 原因 是 : 涉及 旋转 的 节点 的 平衡 因子 具有 相反 的 符 
号 。 此 时 ， 仅 单 向 旋转 是 不 够 的 。 为 了 解决 该 问题 ， 你 需要 进行 两 次 旋转 。 在 旋转 不 平衡 
节点 之 前 ， 先 将 其 孩子 节点 以 相反 的 方向 进行 旋转 ， 使 得 父 节 点 与 孩子 节点 的 平衡 因子 具 
有 相同 符号 ， 这 也 意味 着 第 二 次 旋转 将 会 成 功 。 这 样 一 对 旋转 操作 被 称 为 双 旋 转 (double 
rotation ) 。 

为 了 说 明 双 旋转 操作 ， 让 我 们 考虑 之 前 加 入 C 元素 后 的 不 平衡 树 。 第 一 步 是 绕 Be-H Ah 
向 左旋 转 树 ， 如 下 图 所 示 : 
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虽然 所 和 He 节点 的 平衡 因子 同 号 ， 但 是 得 到 的 树 的 根 节点 仍然 是 不 平衡 的 。 此 时 ， 绕 
H-He 轴 向 右 旋 转 使 树 重新 平衡 ， 如 下 图 所 示 : 
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712 在 安德森 * 维 斯 基 和 兰 带 斯 的 论文 中 ， 阐 述 了 它们 的 树 平 衡 算法 具有 如 下 特性 : 
e 如 果 向 AVL 树 中 插入 一 个 新 节点 ， 总 可 以 通过 至 多 一 次 操作 来 重新 获得 平衡 ， 该 操 
作 要 么 是 一 个 单 旋 转 ， 要 么 是 一 个 双 旋 转 。 
e 在 完成 旋转 操作 之 后 ， 旋 转轴 子 树 的 高 度 总 是 和 在 插入 新 节点 前 一 致 。 该 特性 保证 
了 不 会 改变 树 中 更 高 层次 节点 的 平衡 因子 。 


16.3.5 ”实现 AVL 算法 


尽管 AVL 树 在 实现 insertNode 时 涉及 一 些 细节 ， 但 是 并 没有 你 想 的 那么 困难 。 首 先 
需要 改变 的 是 ， 在 节点 结构 中 应 包括 一 个 新 的 域 来 跟踪 平衡 因子 ， 如 下 所 示 : 
struct BSTNode { 


string key; 
BSTNode *left, *right; 


int bf; 
}; 

insertNode 函数 的 代码 如 图 16-6 所 示 。 从 这 段 代码 中 可 以 看 到 : insertNode 被 实现 为 
函数 insertAVL 的 一 个 包装 器 ， 乍 看 起 来 这 两 个 函数 原型 貌似 相同 。 事 实 上， 这 两 个 函数 

的 参数 确实 相同 。 唯 一 的 不 同 是 函数 insertAVL 返回 一 个 表示 插入 新 节点 后 树 高 度 变化 的 

整数 值 。 该 返回 值 总 是 0 或 者 1， 使 得 当前 代码 沿 递归 调用 的 层次 修复 树 的 结构 变 得 容易 。 

递归 的 简单 情况 如 下 : 
1. 在 空 树 中 加 入 一 个 节点 ， 使 其 树 高 增加 1。 
2. 若 遇 到 已 存在 的 键 值 节点 ， 则 树 高 不 变 。 

在 递归 情况 下 ， 图 16-6 中 的 代码 首先 将 新 节点 插入 到 树 中 适当 的 子 树 中 ， 用 局 部 变量 

delta 追踪 其 高 度 的 变化 。 如 果 插 入 节点 未 改变 子 树 的 高 度 ， 则 当前 节点 的 平衡 因子 必须 

保持 不 变 。 然 而 ， 如 果 插 入 节点 使 子 树 的 高 度 增加 ， 则 有 以 下 三 种 可 能 性 : 
1. 欲 插 入 新 节点 的 子 树 应 比 另 一 个 子 树 矮 。 此 时 ， 插 入 一 个 新 节点 实际 上 使 得 树 比 之 前 
更 加 平衡 。 当 前 节点 的 平衡 因子 变 为 0， 该 节点 的 子 树 的 高 度 不 变 。 

,当前 节点 的 两 棵 子 树 的 规模 相同 。 此 时 ， 增 大 其 中 一 棵 树 会 使 当前 节点 稍微 不 平衡 ， 
但 是 并 不 需要 矫正 措施 。 视 不 同 的 情况 ， 其 节点 平衡 系数 变 为 -1 或 者 +1， 函 数 返回 
1 则 表示 该 节点 的 子 树 高 度 已 增加 。 

3. 较 高 的 子 树 比 另 一 棵 子 树 更 高 。 此 时 ， 由 于 一 棵 子 树 比 男 一 棵 子 树 的 高 度 大 2， 因 
此 ， 树 不 再 平衡 。 这 时 ， 程 序 代码 必须 进行 合适 的 旋转 操作 以 纠正 其 不 平衡 。 如 果 

当前 节点 的 平衡 因子 和 扩展 的 子 树 的 平衡 因子 的 符号 相同 ， 那 么 仅 需 单 旋转 操作 。 
如 果 和 平衡 因子 的 符号 不 同 ， 则 必须 进行 双 旋 转 操作 。 执 行 完 旋转 操作 后 ， 程 序 代码 
必须 修改 位 置 已 改变 的 节点 的 平衡 因子 值 。 节 点 平衡 因子 的 单 旋转 与 双 旋 转 操作 如 
图 16-7 所 示 。 


N 


/* 


* Function: insertNode 


* Inserts a node with the specified key into the correct position in the 
* binary search tree If key already exists in the tree, this call has 
* no effect 


*/ 
void insertNode(BSTNode * & t, const string & key) ( 
insertAVL(t, key); 
) 
/* 


* Function: insertAVL 


* Usage: delta - insertAVL(t, key); 
* 


* Enters the key into the tree that is passed by reference as the first 
* argument. The return value is the change in depth in the tree, which 
* is used to correct the balance factors in ancestor nodes. 


xy 


int insertAVL(BSTNode * & t, const string & key) { 
if (t == NULL) ( 
t = new BSTNode; 
t->key = key; 
t-»bf = 0; 
t-»left = t->right = NULL; 





图 16-6 在 AVL 树 中 插入 一 个 节点 的 代码 
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return *1; 
) 
if (key == t->key) return 0; 
if (key < t->key) ( 
int delta = insertAVL(t-»left, key); 
if (delta == 0) return 0; 
switch (t-»bf) ( 
case +1: t-»bf = 0; return 0; 
case 0: t-»bf = -1; return +1; 
case -1: fixLeftImbalance(t); return 0; 
) 
) else { 
int delta = insertAVL(t-»right, key); 
if (delta == 0) return 0; 
switch (t-»bf) ( 
case -1: t-»bf = 0; return 0; 
case 0: t-»bf = +1; return +1; 
case +1: fixRightImbalance(t); return 0; 


} 


Function: fixLeft Imbalance 
Usage: fixLeftlmbalance (t); 


This function is called when a node has been found that is out of 
balance with the longer subtree on the left Depending on the balance 
factor of the left child, the code performs a single or double rotation 


void fixLeftImbalance(BSTNode * & t) ( 
BSTNode *child - t-»left; 
if (child-»bf !- t-»bf) ( 
int oldBF = child-»right-»bf; 
rotateLeft (t-»left); 
rotateRight (t); 
t-»bf = 0; 
switch (oldBF) { 
case -1: t-»left-»bf = 0; t-»right-»bf = +1; break; 
case 0: t-»left-»bf = t-»right-»bf = 0; break; 
case +1: t-»left-»bf = -1; t-»right-»bf = 0; break; 
} 
} else { 
rotateRight (t) ; 
t-»right-»bf = t->bf = 0; 


Function: rotateLeft 
Usage: rotateLeft (t); 


Performs a single left rotation of the tree passed by reference as the 
argument t The balance factors are unchanged by this function and must 


be corrected at a higher level of the algorithm 


void rotateLeft(BSTNode * & t) ( 
BSTNode *child = t-»right; 
if (DEBUG) ( 
cout << "rotateLeft(" << t->key << "-" << child->key << ")" << endl; 
) 
t-»right = child->left; 
child-»left = t; 
t = child; 


* Function: fixRightImbalance 
Usage: fixRightImbalance (t); 


This function is called when a node has been found that is out of 
balance with the longer subtree on the right. Depending on the balance 
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* factor of the right child, the code performs a single or double rotation 
* f 


void fixRightImbalance(BSTNode * & t) { 
BSTNode *child = t-»right; 
if (child->bf != t-»bf) 1 
int oldBF = child-»left-»bf; 
rotateRight (t-»right); 
rotateLeft (t); 
t-»bf - 0; 
switch (oldBF) ( 
case -1: t-»left-»bf 0; t-»right-»bf = +1; break; 
case 0: t-»left-»bf t->right->bf = 0; break; 
case +1: t-»left-»bf -1; t-»right-»bf = 0; break; 
) 
) eise ( 
rotateLeft (t); 
t-»left-»bf = t->bf = 


Function; rotateRight 
Usage: rotateRight (t) ; 


Performs a single right rotation of the tree passed by reference as the 
argument t The balance factors are unchanged by this function and must 
be corrected at a higher level of the algorithm 


void rotateRight (BSTNode * & t) { 
BSTNode *child - t-»left; 
if (DEBUG) ( 
cout << "rotateRight(" << t->key << "-" << child->key << ")" << endl; 
} 
t-»left = child-»right; 
child->right = t; 
t = child; 





图 16-6 (4) 


使 用 图 16-6 的 AVL 算法 代码 保证 了 在 新 节点 插入 后 仍 能 保持 树 的 平衡 。 这 样 ，findNode 
与 insertNode 困 数 就 都 可 以 以 O (log N) 的 时 间 执 行 。 然 而 ， 即 使 不 对 AVL 策略 进行 扩 
展 ， 上 述 代 码 也 能 正常 运行 。 采 用 AVL 策略 的 优点 就 是 它 以 代码 的 一 些 复杂 性 为 代价 保证 
了 其 O (log N) 的 时 间 性 能 。 





图 16-7 在 AVL 树 中 的 旋转 操作 


482 # 16% 








双 旋 转 
NN | NI 
[| ^NI | ^N 
h i 
T, T; int of 
Be 4 L TA S 
K 16-7 ( 续 ) 
i. 至 少子 树 了 和 TT 中 的 一 个 树 高 为 h， 其 他 子 树 的 树 高 为 有 或 h-1。 树 中 最 终 节点 的 平衡 因子 需要 调整 


以 考虑 其 高 度 之 差 。 


16.4 ”使 用 BST 实现 映射 


在 第 15 章 中 曾 指出 : 标准 模板 库 采 用 二 又 搜索 树 来 实现 映射 的 抽象 。 该 实现 策略 意味 
着 get 和 put 方法 的 运行 时 间 为 O (log NW)， 它 比 哈 希 表 策略 的 平均 运行 时 间 O (1) 效率 稍 
微 低 一 些 。 在 实际 应 用 中 ， 两 者 的 时 间 性 能 差别 并 不 重要 。O (log N) 的 时 间 性 能 图 增长 得 
十 分 缓慢 ， 而 且 与 时 间 性 能 图 O(N) 相 比 ， 它 与 O (1) 的 时 间 性 能 图 更 接近 。C++ 的 设计 者 
们 认为 有 序 地 处 理 键 值 的 能 力 足以 补偿 一 些 额 外 的 时 间 开 销 。 

使 用 二 又 搜索 树 实 现 映 射 抽象 的 困难 之 处 在 于 几乎 整个 二 又 搜索 树 本 身 的 实现 代码 ， 这 
一 点 你 已 看 到 了 。 为 了 将 此 思想 应 用 到 Map EP, BAU PES AEM: 

e. 节点 结构 必须 包含 一 个 与 键 对 应 的 值 域 。 

e. 代码 必须 使 用 模板 来 参数 化 不 同类 型 的 键 和 值 。 

© 操作 树 的 代码 必须 艇 入 Map 类 中 。 
上 述 每 个 改变 都 是 一 个 很 好 的 练习 ， 它 会 巩固 并 加 强 你 对 于 类 的 理解 。 


16.5 F% 


树 出 现在 很 多 应 用 程序 中 。 特 别 有 用 的 一 个 应 用 是 优先 级 队列 (priority queue), P, 
元 素 出 队 的 顺序 取决 于 其 优先 级 。Stanford C++ 类 库 通 过 pqueue .h 接口 实现 了 这 一 概念 ， 该 
接口 导出 了 一 个 PriorityQueue 类 。 除 enqueue 方 法 外 ，Priorityoueue 类 与 标准 类 库 
中 的 Queue 类 的 操作 相同 , enqueue 方法 以 其 第 二 个 参数 指定 其 优先 级 ， 其 原型 如 下 所 示 : 


void enqueue (ValueType element, double priority); 


按照 传统 英语 习惯 ， 低 优先 级 的 元 素 先 人 队 ， 因 此 ， 在 队列 中 优先 级 为 1 的 元 素 排 在 优先 级 
为 2 的 元 素 之 前 。 

在 本 书 第 14 章 习题 8 中 曾 提 及 过 一 次 优先 级 队列 。 如 果 你 使 用 了 该 习题 所 建议 的 策略 ， 
则 enqueue 方法 需要 O(N) 时 间 。 你 可 以 使 用 称 为 偏 序数 ( partially ordered tree) 的 数据 
结构 来 改善 优先 级 队列 的 时 间 性 能 至 O (log N)， 偏 序数 满足 以 下 特性 : 

1. 该 树 是 一 棵 二 又 树 ， 在 树 中 每 个 节点 最 多 有 两 个 孩子 节点 。 然 而 ,该 树 不 是 一 棵 二 又 
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搜索 树 ， 二 又 搜索 树 与 偏 序数 有 着 不 同 的 排序 规则 。 

2. 树 中 的 节点 尽量 被 分 配 成 对 称 的 。 因 此 ， 沿 树 的 任何 路 径 上 的 节点 数 之 间 相 差 不 超过 
1。 而 且 ， 叶 子 节点 必须 严格 从 左 到 右 填 充 。 

3. 树 中 每 个 节点 的 键 值 都 小 于 等 于 它 孩 子 节点 的 键 值 。 因 此 ， 树 中 最 小 的 键 值 往往 都 在 
根 节 点 。 

例如 ， 下 图 展示 了 有 四 个 节点 的 偏 序 数 ， 每 个 节点 都 包含 了 一 个 数字 键 值 : 





树 的 第 二 层 被 完全 填充 ， 第 三 层 正 处 于 从 左 向 右 填 充 的 过 程 ， 满 足 偏 序数 的 第 二 个 特性 。 第 
三 个 特性 也 满足 ， 因 为 树 中 任意 节点 的 键 值 都 小 于 其 孩子 节点 的 键 值 。 

假如 你 想 添 加 一 个 键 值 为 2193 的 节点 。 很 显然 能 看 出 该 节点 应 添加 到 哪里 。 要 求 树 的 
最 底层 从 左 至 右 进行 填充 意味 着 新 的 节点 应 添加 到 以 下 位 置 ; 





然而 ， 该 图 违反 了 偏 序数 的 第 三 个 特性 ， 因 为 键 值 2193 小 于 它 的 父 节点 的 键 值 2708。 
为 了 解决 该 问题 ， 应 交换 这 两 个 节点 的 键 值 ， 如 下 图 所 示 : 





通常 ， 新 插入 的 节点 都 不 得 不 通过 一 连 串 向 上 的 移动 来 和 它 的 父 节点 进行 交换 。 在 该 实 
例 中 ， 交 换 过 程 终 止 在 2193， 因 为 它 已 比 其 父 节点 1604 大 。 在 任何 情况 下 ， 树 的 结构 保证 
了 这 些 交 换 的 时 间 复 杂 度 永远 不 会 超过 O (log N)。 

偏 序数 的 结构 意味 着 树 中 最 小 的 键 值 往往 都 处 于 根 节 点 处 。 然 而 ， 删 除根 节点 需要 花费 
些 功夫 ， 因 为 你 必须 重新 排列 那些 不 是 树 的 最 底层 的 最 右边 的 所 有 节点 。 标 准 的 做 法 是 : 用 
要 删除 的 节点 的 键 值 来 替换 根 节点 ， 然 后 顺 着 树 向 下 交换 键 值 直到 满足 有 序 特 性 为 止 。 例 
如 ， 如 果 你 想 删 除 上 图 中 树 的 根 节 点 ， 第 一 步 是 用 树 中 最 底层 最 右边 的 节点 2708 来 替换 根 
节点 ， 如 下 图 所 示 
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然后 ， 由 于 树 的 节点 顺序 并 不 符合 要 求 ， 你 需要 用 2708 两 个 孩子 节点 中 较 小 的 那个 替换 
2708， 如 下 图 所 示 : 





尽管 在 本 例 中 ， 一 次 简单 的 交换 足以 使 得 树 保 持 有 序 性 ， 但 通常 情况 下 ， 寻 找 移动 到 根 节 点 
元 素 的 正确 位 置 可 能 需要 经 过 树 的 每 一 层 来 进行 元 素 交 换 。 和 插入 一 样 ， 删 除 最 小 的 键 值 需 
要 的 时 间 复 杂 度 为 O (log N)。 

定义 偏 序数 的 操作 正好 是 你 实现 优先 级 队列 所 需要 的 操作 。enqueue 操作 包括 向 偏 序 
数 插入 一 个 新 节点 。dequeue 操作 则 是 删除 树 中 的 最 小 值 。 因 此 ， 如 果 你 将 偏 序数 作为 底 
层 实 现 ， 你 就 可 以 以 O (log N) 的 时 间 复 杂 度 来 实现 优先 级 队列 。 

尽管 你 可 以 使 用 基于 指针 的 结构 来 实现 偏 序数 ， 但 是 优先 级 队列 的 大 多 数 实 现 采用 的 是 
一 个 基于 数组 的 结构 ， 该 结构 被 称 为 堆 (heap)， 它 用 来 模拟 偏 序 数 的 操作 。( 挫 这 个 术语 听 
起 来 令 人 困惑 ， 因 为 堆 数据 结构 和 动态 分 配 内 存 时 的 可 用 内 存 池 没 多 大 关系 ， 两 者 同名 但 不 
同 义 。) 堆 的 实现 策略 取决 于 这 一 特性 : 你 可 以 在 一 个 数组 的 前 入 个 元 素 中 ， 一 层 接 一 层 地 
从 左 向 右 存 储 容量 为 N 的 偏 序数 的 节点 。 

例如 ， 下 面 的 偏 序数 : 





可 以 用 以 下 的 堆 表 示 : 
0 1 2 3 4 b 6 


堆 的 组 织 结构 使 得 实现 树 的 操作 变 得 简单 ， 因 为 父 节点 和 孩子 节点 都 处 于 易于 计算 的 位 
置 。 例 如 ， 给 定 索引 位 置 为 款 的 节点 ， 你 可 以 使 用 以 下 表达 式 来 找 出 其 父 节 点 和 孩子 节点 的 
索引 : 


parentIndex (n) 常 由 (n - 1) / 2 给 定 
leftChildIndex (n) 常 帕 2 * n + 1 给 定 
rightChildIndex (n) 常 由 2 * n + 2 给 定 


parent Index 的 除法 运算 采用 C++ 标准 整数 除法 运算 。 因 此 ， 索 引 位 置 为 4 的 节点 的 父 
节点 计算 结果 显示 为 数组 中 索引 为 1 的 节点 ， 因 为 (4-1) /2 的 运算 结果 为 1。 

实现 基于 堆 的 优先 级 队列 是 一 个 很 好 的 练习 ， 它 会 提高 你 的 编程 技巧 并 且 给 你 更 多 的 关 
于 如 何 使 用 本 文中 所 见 到 的 数据 结构 的 体验 。 在 习题 13 中 你 将 会 得 到 这 样 一 个 机 会 。 
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本 章 小 结 
在 本 章 中 ， 你 接触 到 了 树 的 概念 ， 它 是 节点 的 层次 化 的 集合 ， 满 足 如 下 特性 : 


在 树 的 顶部 有 一 个 唯一 节点 构成 了 树 层次 化 的 根 。 
树 中 的 每 一 个 节点 都 有 一 条 唯一 的 通 向 根 节 点 的 路 径 。 


本 章 的 重点 内 容 包括 : 


许多 用 来 描述 树 的 术语 ， 例 如 “ 父 节点 ”“ 和 孩子 节点 ”“ 和 祖先 节点 ” “子孙 节点 ”“ 兄 
弟 节 点 "， 都 直接 来 自 于 家 谱 树 。 另 外 二 些 术 语 ， 包 括 “ 根 节点 ”和 “叶子 节点 ”， 
则 直接 来 源 于 自然 界 中 的 树 。 这 些 比喻 使 得 用 于 树 的 专业 术语 易于 理解 ， 因 为 这 些 
词语 在 计算 机 科学 中 的 解释 与 通常 的 解释 相同 。 

树 具有 一 种 良好 定义 的 递归 结构 ， 因 为 树 中 的 每 个 节点 都 是 其 子 树 的 根 节点 。 因 此 ， 
一 棵 树 是 由 一 个 节点 以 及 其 孩子 节点 的 集合 构成 ， 树 中 又 有 树 。 这 种 递归 结构 反映 
在 树 的 底层 表示 上 ， 该 结构 被 定义 为 指向 一 个 节点 的 指针 ; 一 个 节点 继而 成 为 包含 
树 的 结构 。 

二 叉 树 是 树 的 一 个 子 类 ， 其 中 每 个 节点 最 多 拥有 两 个 孩子 节点 ， 并 且 除 了 根 节点 之 
外 ， 每 个 节点 要 么 是 其 父 节 点 的 左 孩子 节点 ， 要 么 是 右 孩 子 节点 。 

如 果 一 个 二 叉 树 中 的 每 一 个 节点 都 包含 一 个 键 值 域 ， 其 键 值 总 是 小 于 其 右 子 树 的 所 
有 键 值 ， 大 于 其 左 子 树 的 所 有 键 值 ， 那 么 这 个 二 叉 树 被 称 为 二 又 搜索 树 。 正 如 其 名 
字 所 暗示 的 ， 二 又 搜索 树 的 结构 采用 了 二 分 查找 算法 ， 这 使 得 寻找 单个 键 值 变 得 更 
加 高 效 。 因 为 在 树 中 键 值 是 有 序 的 ， 因 此 ， 往 往 能 够 确定 你 所 搜索 的 键 值 是 在 某 个 
节点 的 左 子 树 上 还 是 在 右 子 树 上 。 

使 用 递归 使 得 访问 二 叉 搜索 树 中 的 节点 更 加 容易 ， 这 种 操作 被 称 为 树 的 遍历 
(traversing 或 walking)。 有 几 种 类 型 的 遍历 ， 遍 历 类 型 取决 于 处 理 节点 的 顺序 。 如 果 
每 个 节点 的 键 值 在 递归 调用 处 理 其 子 树 前 被 处 理 ， 那 么 它 就 称 为 先 序 遍 历 。 如 果 对 
于 每 个 节点 的 处 理 是 在 处 理 其 左右 子 树 的 两 个 递归 调用 之 后 ， 就 称 为 后 序 遍 历 。 而 
在 处 理 某 个 节点 的 左右 子 树 的 两 个 递归 调用 之 间 来 处 理 当前 节点 ， 则 称 为 中 序 遍 历 。 
在 一 棵 二 又 搜索 树 中 ， 中 序 遍 历 由 于 其 键 值 按 顺 序 处 理 这 一 特性 而 更 为 有 用 。 

给 定 相 同 的 节点 集 ， 根 据 不 同 的 顺序 插入 节点 ， 二 又 搜 索 树 的 结构 也 会 完全 不 同 。 
如 果树 的 分 支 在 高 度 上 有 很 大 不 同 ， 则 该 树 是 不 平衡 的 ， 这 也 会 降低 其 效率 。 使 用 
AVL 算法 ， 可 以 在 加 入 新 节点 的 同时 维持 树 的 平衡 。 

使 用 堆 数据 结构 可 以 高 效 实现 优先 级 队列 ， 该 数据 结构 基于 二 又 树 的 一 个 特殊 的 子 
类 一 一 偏 序数 。 如 果 使 用 堆 表 示 ，enqueue 和 dequeue 操作 的 时 间 复 杂 度 均 为 
O (log N). 


复习 题 

1. 一 个 节点 集 要 组 成 树 ， 必 须 满足 的 两 个 条 件 是 什么 ? 

2. 给 出 四 个 现实 世界 有 关 树 结构 的 例子 。 

3. 定义 用 于 树 的 这 些 术语 : 父 节 点 、 和 孩子 节点 、 祖 先 节点 、 子 孙 节 点 和 兄弟 节点 。 

4. 莎士比亚 时 代 统 治 英国 都 铎 家 族 的 家 谱 树 如 图 16-8 所 示 。 找 出 根 节点 、 叶 子 节点 和 内 部 节点 。 该 树 
的 树 高 是 多 少 ? 

5. 有 关 树 的 什么 特征 使 得 树 是 递归 的 ? 
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6. 画 出 将 图 16-8 中 的 树 表示 为 一 个 FamilyTreeNode 时 的 内 部 结构 。 

7. 二 叉 搜索 树 的 定义 特性 是 什么 ? 

8. 为 什么 findNode 和 insertNode 中 的 第 一 个 参数 使 用 不 同类 型 声明 ? 

9. 在 英国 作家 托 尔 金 的 小 说 《起 比特 人 》 中 ，13 个 小 矮人 以 如 下 的 顺序 来 到 比尔 博 . 巴金 斯 的 屋子 : 
Dwalin, Balin, Kili, Fili, Dori, Nori, Ori, Oin, Gloin, Bifur, Bofur, Bombur 


和 Thorin。 画 出 将 这 些小 矮人 的 名 字 插 入 到 一 棵 空 树 中 所 产生 的 二 叉 搜索 树 。 


Henry VII 
Margaret Henry VIII Arthur Mary 
James Mary Elizabeth I Edward VI Frances 
Mary Queen of Scots Jane Grey Catherine Grey 
James I 
724 图 16-8 都 铎 家 族 树 
10. 给 定 你 在 第 9 题 中 创建 的 树 ， 回 答 问题 : 如 果 你 在 Bombur 节点 上 调用 findNode, 需要 与 哪些 
键 值 进 行 比较 ? 


11. 分 别 写 出 第 9 题 中 你 所 创建 的 树 的 前 序 遍 历 、 中 序 遍 历 和 后 序 遍 历 。 

12. 在 树 的 三 种 遍历 方式 中 ， 有 一 种 是 不 依赖 于 树 中 插 和 人 节点 的 顺序 的 ， 请 问 这 是 哪 一 种 遍历 方式 ? 
13. 一 棵 二 又 树 是 平衡 的 ， 其 含义 是 什么 ? 

14. 对 于 以 下 每 一 种 树 的 结构 ， 判 断 其 是 否 平衡 ? 


对 于 不 平衡 的 树 ， 指 出 哪个 节点 不 平衡 。 
15. 判断 题 : -如 果 一 棵 二 叉 搜 索 树 不 平衡 ， 那 么 函数 findNode 和 insertNode 的 算法 将 不 能 正常 运行 。 


16. 如 何 计算 一 个 节点 的 平衡 因子 ? 
17. 在 下 面 的 二 叉 搜索 树 中 ， 填 充 各 节点 的 平衡 因子 。 
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18. 如 果 你 使 用 AVL 平衡 策略 ， 对 于 前 一 题 中 的 树 需要 什么 旋转 操作 来 使 它 重新 平衡 ? 包含 更 新 的 平 
衡 因子 的 结果 树 的 结构 是 什么 ? 

19. 判断 题 : 当 你 向 一 棵 平衡 二 叉 树 插入 新 节点 时 ， 你 总 能 通过 执行 一 次 操作 矫正 带 来 的 不 平衡 ， 该 操 
作 要 人 么 是 一 次 单 旋转 ， 要 么 是 一 次 双 旋 转 。 

20. 正如 在 16.3.2 一 节 中 所 展示 的 那样 ， 向 一 个 AVL 树 插 和 人 前 六 个 化 学 元 素 符号 得 到 如 下 布局 : 





当 继续 插 入 以 下 六 个 元 素 符号 时 ， 树 的 状态 会 发 生 什么 变化 : 


N (A) 
o CA) 
F (CK) 
Ne (A) 
Na (4) 
Mg (4X) 


21. 详细 描述 insertNode 的 调用 过 程 。 
22. 为 了 避免 在 删除 二 又 搜索 树 中 的 一 个 中 间 节 点 时 树 不 相连 的 问题 ， 本 章 提出 了 什么 策略 ? 
23. 假如 你 在 处 理 一 棵 偏 序数 ， 该 树 包 含 如 下 数据 : 





给 出 插入 键 值 为 1521 的 节点 后 的 树 状 态 。 
24. 堆 和 偏 序 数 之 间 的 关系 是 什么 ? 


习题 
1. Æ 16.1.3 一 节 中 ,给 出 了 FamilyTreeNode 的 定义 ， 试 编写 一 个 函数 : 
FamilyTreeNode *readFamilyTree(string filename); 


该 函数 从 一 个 数据 文件 中 读 取 一 棵 家 谱 树 ， 数 据 文件 名 作为 参数 传递 给 函数 。 文 件 的 第 一 行 是 树 的 
根 节 点 名 。 数 据 文件 接 下 来 的 所 有 行 按 以 下 格式 排列 : 

孩子 节点 : 父 节点 
其 中 ， 和 孩子 节点 是 一 个 新 输入 的 节点 名 ， 父 节点 则 是 孩子 节点 的 父 节 点 名 ， 父 节点 名 一 定 在 数据 文 
件 的 前 面 。 例如， 如 果 文 件 Noemandy .txt WF: 


William II:William I 
Adela:William I 
Henry I:William I 
Stephen:Adela 


William:Henry I 
Matilda:Henry I 
Henry II:Matilda 
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调用 readFamilyTree ("Normandy.txt") 将 返回 图 16-2 所 示 的 结构 。 
2. 编写 函数 ; 


void displayFamilyTree(FamilyTreeNode *tree); 


- 该 函数 显示 家 谱 树 中 所 有 的 个 体 。 为 了 记录 树 的 层次 结构 ， 程 序 的 输出 应 该 将 每 一 代 分 开 ， 使 得 每 
727 个 孩子 节点 名 相对 其 父 节 点 名 向 右 缩 进 两 个 空格 ， 运 行 示例 如 下 图 所 示 : 





————— 


t DGF 


w 


.正如 本 章 中 定义 的 ，FamilyTreeNode 结构 使 用 一 个 矢量 来 存储 孩子 节点 。 另 一 种 方案 是 在 这 些 
节点 中 包含 一 个 指针 来 构建 一 个 孩子 节点 的 链表 。 在 这 个 设计 中 ， 每 一 个 节点 需要 两 个 指针 : 一 个 
指向 最 年 长 的 孩子 节点 ; 一 个 指向 它 的 下 一 个 年 轻 的 兄弟 节点 。 使 用 这 种 表示 ， 诺 曼 底 家 族 的 家 谱 
树 如 图 16-9 所 示 。 在 每 个 节点 上 ， 左 指针 总 是 指向 一 个 孩子 节点 ; 右 指针 则 指向 同 代 的 兄弟 节点 。 
Auk, William I 最 年 长 的 孩子 节点 是 Robert， 可 以 顺 着 图 的 左边 找到 。 剩 下 的 孩子 节点 都 通过 一 个 
链 连接 在 一 起 。 孩 子 节点 以 Henry I 终止 ,该 节点 的 兄弟 节点 指针 为 空 。 

使 用 下 图 所 示 的 链表 策略 ， 写 出 FamilyTreeNode、readFamilyTree 和 display- 
FamilyTree 的 定义 。 





728 图 16-9 使 用 一 个 兄弟 列表 的 诺曼底 家 族 


4. 在 习题 3 中 ， 改 变 FamilyTreeNode 结构 使 得 你 必须 重 写 函 数 readFamilyTree fll display- 
FamilyTree， 因 为 这 两 个 图 数 依赖 于 其 内 部 实现 。 如 果 用 一 个 类 来 实现 就 会 维护 接口 不 受 变化 影 
响 ， 也 会 避免 过 多 的 重复 编码 工作 。 图 16-10 给 出 了 这 样 一 个 接口 。 编 写 该 接口 相应 的 实现 代码 ， 
使 用 一 个 矢量 来 存储 孩子 节点 。 


File: familytree.h 


This file is an interface to a simple class that represents an individual 


Person in a family tree. 
> j 





图 16-10 FamilyTreeNode 类 的 接口 
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#ifndef _familytree_h 
#tdefine _familytree_h 


#include <string> 
#include "vector.h" 


/* 
* Class: FamilyTreeNode 


This class defines the structure of an individual in the family 
tree, which consists of a name and a vector of children. 
ay 
class FamilyTreeNode { 
public: 


/* 
Constructor: FamilyTreeNode 
Usage: FamilyTreeNode *person - new FamilyTreeNode (name); 


Constructs a new FamilyTreeNode with the specified name. The 


newly constructed entry has no children, but clients can add 
* children by callinq the addChild method. 


FamilyTreeNode(const std::string & name); 


Method: getName 
Usage: string name = person-»getName(); 


Returns the name of the person. 


*7 
string getName() const; 


* Method: addChild 
Usage: person-»addChild (child); 


Adds child to the end of the list of children for person, 
makes person the parent of child. 


void addChild(FamilyTreeNode *child) ; 


Method: getParent 
Usage: FamilyTreeNode *parent = person->getParent () ; 


Returns the parent of the specified person. 
iai 


FamilyTreeNode *getParent() const; 


Method: getChildren 
Usage: Vector«FamilyTreeNode *> children = person-»getChildren(); 


Returns a vector of the children of the specified person. 
Note that this vector is a copy of the one in the node, so 
that the client cannot change the tree by adding or removing 
children from this vector. 


/ 
Vector«FamilyTreeNode *» getChildren() const; 


类 的 私有 部 分 在 这 。 


}; 
#endif 





图 16-10 (4%) 


731 


490 #16F 


5. 使 用 图 16-10 所 定义 的 familytree.h 接口 ， 编 写 一 个 函数 : 


FamilyTreeNode *commonAncestor (FamilyTreeNode *p1l, 
FamilyTreeNode *p2); 


它 返回 pl Al p2 共同 的 最 近 的 祖先 节点 。 


6. 使 用 16.2 节 中 BSTNode 的 定义 ， 编 写 一 个 函数 : 


oo 


int height(BSTNode *tree); 


该 函数 取 一 棵 二 叉 搜 索 树 为 参数 ， 并 返回 其 高 度 。 


. 编写 一 个 函数 : 


bool isBalanced(BSTNode *tree); 

它 根据 平衡 树 的 定义 判断 树 是 否 平衡 。 为 了 解决 该 问题 ， 你 所 要 做 的 就 是 将 平衡 树 的 定义 直接 翻译 
成 代码 。 然 而 ， 这 样 做 最 后 的 实现 可 能 相当 低 效 ， 因 为 这 需要 在 树 中 遍历 好 几 遍 。 该 问题 的 真正 难 
点 在 于 : 在 对 节点 进行 不 多 于 一 次 检查 的 情况 下 ，isBalanced 函数 的 实现 就 能 判断 出 结果 。 


. 编写 一 个 函数 : 


bool hasBinarySearchProperty (BSTNode *tree); 


该 函数 接受 一 棵 树 并 判断 它 是 否 具 有 二 又 搜索 树 的 基本 特性 : 每 个 节点 的 键 值 必须 大 于 其 左 子 树 所 
有 节点 的 键 值 ， 而 小 于 其 右 子 树 所 有 节点 的 键 值 。 


9. 本 书 对 于 AVL 算法 的 讨论 为 插入 节点 提供 了 一 个 策略 ， 但 并 不 适用 于 具有 对 称 过 程 的 删除 操作 ， 该 


操作 同样 要 求 使 树 保持 平衡 。 其 实 ， 这 两 个 算法 特别 相近 。 删 除 节点 有 可 能 对 于 树 的 高 度 没什么 影 
响 ， 但 也 有 可 能 使 其 高 度 减 1。 如 果 一 棵 树 变 矮 了 ， 那 么 它 的 父 节点 平衡 因子 也 会 发 生 改变 。 如 果 
父 节点 不 再 平衡 ， 可 以 通过 单 旋转 或 双 旋 转 来 使 其 恢复 平衡 。 

KA FAA AK: 
void removeNode (BSTNode * & t, const string & key); 
该 函数 在 保持 底层 的 AVL 树 平衡 的 条 件 下 ， 从 树 中 删除 包含 键 值 为 key 的 节点 。 思 考 一 下 会 出 现 
的 各 种 问题 ， 并 且 确 保 你 的 实现 可 以 正确 处 理 这 些 不 同情 况 。 


10. 以 16.4 小 节 的 讨论 为 指导 ， 使 用 二 又 搜索 树 作 为 底层 实现 来 实现 map .h 接口 。 以 图 15-1 展示 的 


简单 版 的 StringMap 作为 开始 。 一 旦 你 开始 进行 ， 就 去 实现 那些 遗漏 的 操作 。 


11. 在 第 5 章 习 题 19 中 ， 你 有 机 会 编写 一 个 程序 ， 将 摩尔 斯 码 信息 翻译 成 等 价 的 英语 字母 。 该 练习 鼓 


励 你 使 用 一 个 映射 来 存储 翻译 表 ， 但 是 也 有 其 他 方法 。 例 如 ， 你 可 以 将 摩尔 斯 码 想 象 成 一 棵 二 又 
树 ， 点 代表 向 左 ， 破 折 号 代表 向 右 。 用 这 种 形式 ， 得 到 的 摩尔 斯 码 表 的 结构 如 图 16-11 所 示 。 例 如 ， 
你 可 以 从 根 节 点 开始 ， 以 左 - 右 - 左 - 左 的 顺序 沿 着 链 向 下 找到 字母 L，L 的 摩尔 斯 码 就 是 *=*。 





图 16-11 摩尔 斯 码 树 


12. 


13. 


14. 


15. 
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设计 一 个 数据 结构 存储 图 16-11 的 树 ， 之 后 编写 函数 getMorseCodeLetter (code), Kame 
找 与 字符 串 参 数 code 代表 的 摩尔 斯 码 对 应 的 字母 。 

从 实际 观点 看 ，AVL 算法 过 于 严 苛 。 因 为 它 要 求 每 个 节点 的 子 树 高 度 差 永远 不 能 超过 1， 在 新 节点 
插入 时 ，AVL 算法 花费 可 一 点 时 间 执 行 旋 转 操作 来 保持 平衡 。 如 果 你 允许 树 有 些 不 平衡 ， 但 是 仍 
旧 使 其 左右 子 树 尽 可 能 相似 ， 那 么 你 可 以 在 很 大 意义 上 减少 一 部 分 操作 开销 。 

二 又 搜索 树 的 一 种 数据 结构 提供 了 更 好 的 性 能 ， 该 结构 被 称 为 红 黑 树 ( red-black tree), HH 
来 源 于 树 中 每 个 节点 都 被 染色 ， 要 么 是 红色 ， 要 么 是 黑色 。 如 果 一 棵 二 又 树 全 部 满足 以 下 三 个 特 
性 ， 它 就 是 一 棵 红 黑 树 : 

1. 根 节 点 是 黑色 的 。 

2. 每 一 个 节点 的 父 节 点 是 黑色 的 。 

3. 从 根 节 点 到 叶子 节点 的 所 有 路 径 上 ， 黑 色 节 点 的 数目 相等 。 

这 几 个 特性 保证 了 从 根 节点 到 叶子 节点 的 最 长 路 径 不 会 比 最 短路 径 长 两 倍 以 上 。 从 给 定 的 这 些 规 
则 中 ， 你 已 经 知道 每 一 条 路 径 都 含有 相同 数目 的 黑色 节点 ， 这 也 就 意味 着 最 短 的 路 径 可 能 全 部 由 
黑色 节点 组 成 ， 而 最 长 的 路 径 则 由 黑色 节点 和 红色 节点 交替 出 现 组 成 。 尽 管 这 些 条 件 相 比 于 使 用 
AVL 算法 的 平衡 树 的 定义 而 言 并 不 那么 苛刻 ， 但 是 也 足以 保证 在 0 (log N) 的 时 间 复 杂 度 级 别 上 进 
行 寻找 和 插入 节点 操作 。 

使 红 黑 树 得 以 正确 工作 的 关键 是 找到 一 个 插入 算法 ， 使 得 在 保持 定义 红 黑 树 的 前 提 下 加 入 新 
的 节点 。 该 算法 和 AVL 算法 有 很 多 相同 之 处 ， 并 使 用 同样 的 旋转 操作 。 第 一 步 是 使 用 不 带 平衡 功 
能 的 标准 插入 操作 插入 新 节点 。 新 节点 总 是 替代 树 中 某 个 位 置 的 NULL 项 。 如 果 该 节点 是 插入 树 中 
的 第 一 个 节点 ， 它 就 成 为 树 根 而 被 赋予 黑色 。 在 其 他 所 有 情况 下 ， 新 节点 必须 初始 化 为 红色 ， 以 
避免 违反 从 根 节 点 到 叶子 节点 的 每 一 条 路 径 上 都 包含 相同 数量 黑色 节点 的 规则 。 

只 要 新 节点 的 父 节点 是 黑色 的 ， 那么 该 树 仍旧 是 一 颗 合 法 的 红 黑 树 。 如 果 父 节点 也 是 红色 的 ， 
就 会 出 现 问题 ， 这 意味 着 该 树 违 反 了 第 二 条 规则 ， 要 求 每 个 红色 节点 的 双亲 为 黑色 节点 。 在 这 种 
情况 下 ， 需 要 对 树 重新 进行 构造 以 满足 红 黑 树 的 条 件 。 根 据 红 - 红 对 和 树 中 其 他 节点 的 关系 ， 可 
以 通过 执行 下 列 其 中 一 个 操作 来 解决 这 个 问题 : 

1. 一 次 单 旋 转 ， 同 时 进行 一 个 重新 着 色 ， 让 项 部 节点 为 黑色 。 

2. 一 次 双 旋 转 ， 同 时 进行 一 个 重新 着 色 ， 让 顶部 节点 为 黑色 。 

3. 颜色 的 简单 变化 ， 让 顶部 节点 为 红色 ， 接 着 在 更 高 的 层次 上 对 树 进行 进一步 重新 构造 。 

这 三 个 操作 在 图 16-12 中 进行 了 说 明 。 图 中 只 显示 了 不 平衡 发 生 在 左边 的 情况 。 发 生 在 右边 的 情况 
可 以 对 称 地 进行 处 理 。 

重新 实现 Map 类 ， 用 红 黑 树 作为 其 底层 表示 。 当 你 调试 你 的 程序 时 ， 会 发 现实 现 一 个 函数 来 
展示 树 结 构 并 包含 节点 颜色 (对 用 户 不 可 见 ) 是 很 有 用 的 。 该 方法 应 该 能 在 树 发 生变 化 时 检查 是 否 
符合 构建 红 黑 树 的 规则 。 

使 用 16.5 一 节 中 的 算法 来 实现 Priorityoueue 类 ， 用 堆 作 为 底层 表示 。 为 了 消除 一 些 复杂 性 ， 
使 用 一 个 矢量 要 比 一 个 动态 数组 更 好 。 

堆 数 据 结构 为 排序 算法 提供 了 基础 ， 它 总 是 以 O(N log N) 时 间 复 杂 度 运行 。 在 堆 排 序 ( heapsort) 
算法 中 ， 你 需要 将 每 个 值 输入 到 堆 中 ， 并 且 按 从 最 小 到 大 的 顺序 取出 这 些 项 。 使 用 该 策略 写 出 一 
个 函数 模板 来 实现 堆 排 序 : 


template <typename ValueType> 
void sort(Vector<ValueType> & vec); 


除了 本 章 介绍 的 树 的 应 用 ， 还 有 很 多 其 他 树 的 应 用 。 例 如 ， 可 以 用 树 实现 一 个 字典 ， 这 在 第 5 
章 曾 介绍 过 。 这 种 方式 实现 的 结构 ， 由 爱德华 弗 雷 德 在 1960 年 首次 提出 ， 并 被 命名 为 字典 树 
(trie)。 基 于 字典 树 对 字典 的 实现 ， 尽 管 对 空间 的 使 用 有 些 低 效 ， 但 是 可 以 比 使 用 哈 希 表 更 快 地 
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情况 1: MARE ( 或 不 存在 ) ; N, 入 ,在 同一 方向 上 不 平衡 






情况 2: 入, 为 黑色 (或 不 存在 ) ; 和 N, 和 ,在 相反 方向 上 不 平衡 





dai 


情况 3: N 为 红色 ; N, 和 ,的 相对 平衡 无 关 紧 要 





16-12 在 一 棵 红 黑 树 上 的 旋转 操作 


找到 单词 。 

在 字典 树 中 的 每 一 层 ， 每 一 个 节点 都 有 26 个 分 支 ， 每 个 分 支 代表 字母 表 中 每 个 可 能 的 字母 。 
当 使 用 字典 树 来 表示 字典 时 ， 单 词 被 隐 含 地 存储 在 树 结 构 中 ， 它 们 被 表示 为 从 根 节点 向 下 的 一 个 
序列 。 树 根 对 应 于 空 字符 串 ， 每 一 个 随后 的 层次 对 应 于 在 其 父 节 点 表示 的 字符 串 后 加 入 了 一 个 字 
母 构 成 的 单词 的 子 集 。 例 如 ， 根 节点 下 的 A 链接 的 子 树 包含 一 个 所 有 以 A 开头 的 单词 ， 该 A 节点 
下 一 层次 的 B 链接 的 子 树 包 含 了 所 有 以 AB 开头 的 单词 ， 以 此 类 推 。 每 个 节点 有 一 个 标记 指明 到 
该 节点 为 止 的 子 串 是 否 是 一 个 合理 的 单词 。 

举例 理解 字典 树 结构 比 用 定义 来 理解 要 容易 得 多 。 图 16-13 展示 了 包含 六 个 元 素 符 号 H, 
He、Li、Be、B 和 C 的 字典 树 。 该 树 根 对 应 于 空 字符 串 ， 就 像 该 结构 最 右边 域 中 的 符号 no 
所 指明 的 那样 : 它 是 一 个 不 合法 的 符号 。 从 该 字典 树 的 碍 六 点 中 的 标记 为 B 出 发 所 下 降 的 节点 
对 应 字符 串 "B"。 该 节点 最 右边 的 域 为 Yes， 表明 "B" 本 身 是 一 个 合法 的 符号 。 从 这 个 节点 ， 
标记 为 E 的 链接 导致 了 一 个 新 的 节点 ， 它 代表 字符 串 "BE" 也 是 一 个 合法 的 符号 。 字 典 树 中 的 
NULL 指针 说 明 没 有 合法 的 符号 出 现在 该 子 串 开始 的 子 树 中 ， 因 此 可 以 结束 搜索 过 程 了 。 

以 字典 树 作 为 内 部 表示 重新 实现 Lexicon 类 。 该 实现 要 能 够 读 取 文本 文件 ， 但 不 能 读 取 类 似 
EnglishWords.dat 的 二 进 制 数 据 文件 。 
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图 16-13 BANKS H, He, Li, Be, BAIC 的 字典 树 


第 17 章 | 


Programming Abstractions in C++ 


E a 


我 们 是 一 个 雄心 勃勃 的 集合 ， 不 是 吗 ? 
— 4G + te RRA, CA), 1868 


Set fll HashSet 类 在 第 5 章 都 出 现 过 。 和 本 书 剩 余 章节 一 样 ， 本 章 的 目标 就 是 学 习 如 
何 实现 这 些 类 。 讨 论 这 些 类 如 何 实现 费 不 了 多 少 口舌 ， 参 考 Map 和 HashMap 类 的 实现 ， 相 
应 的 Set 类 是 很 容易 实现 的 。 因 此 本 章 将 接受 另 一 项 挑战 ， 使 用 一 种 理论 上 更 精确 的 方法 
定义 集合 类 set。 集 合 对 于 计算 机 科学 理论 和 实践 这 两 方面 都 非常 重要 。 理 解 这 个 原理 能 使 
你 更 容易 在 程序 中 有 效 使 用 集合 。 


17.1 集合 作为 一 种 数学 抽象 

在 你 学 习 数 学 时 ， 肯 定 经 常会 遇 到 集合 。 尽 管 集合 的 定义 并 不 完全 准确 ， 最 好 是 将 集合 
(set) 看 作 是 一 个 不 同 元 素 组 成 的 无 序 集合 。 例 如 ， 一 周 的 天 数组 成 了 一 个 具有 七 个 元 素 的 
集合 ， 它 可 以 写成 下 面 的 形式 : 


{ Sunday, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday } 


上 述 集合 中 的 元 素 以 这 种 顺序 书写 只 是 因为 这 样 比较 符合 习惯 。 如 果 你 用 别 的 顺序 书写 这 些 
元 素 ， 仍 会 得 到 同样 的 集合 。 然 而 ， 一 个 集合 绝 不 能 包含 相同 的 元 素 。 

工作 日 集合 是 一 个 有 限 集 ( finite set)， 因 为 它 包 含有 限 个 元 素 。 在 数学 中 ， 也 存在 无 限 
集 (infinite set)， 例 如 所 有 整数 的 集合 。 在 一 个 计算 机 系统 中 ， 集 合 通常 是 有 限 的 ， 即 使 它 
们 对 应 数学 中 的 无 限 集 。 例 如 ， 整 数 集合 就 是 一 个 有 限 集 ， 因 为 计算 机 可 以 用 int 类 型 的 变 
量 来 表示 集合 中 的 元 素 ， 并 且 计 算 机 硬件 对 整数 范围 施加 了 限制 。 

为 了 说 明 集合 的 基本 操作 ， 使 用 几 个 集合 作为 基础 是 很 重要 的 。 为 了 和 数学 惯例 保持 一 
致 ， 本 教材 使 用 以 下 符号 来 代表 所 要 表示 的 集合 : 

Ø BK (empty set)， 不 包含 任何 元 素 

ZL 所 有 整数 的 集合 

N ”自然 数 (natural number) 集合 ， 在 计算 机 科学 中 通常 被 定义 为 : 0,1,2,3, 

R 所 有 实数 的 集合 

遵循 数学 惯例 ， 本 书 使 用 大 写字 母 表示 集合 。 集 合 的 全 体 成 员 (如 N、Z 和 RR) 使 用 黑 
体 字母 表示 。 某 些 未 详细 说 明 的 集合 名 用 斜体 字母 表示 ， 例 如 ， 集 合 S 和 集合 7。 


17.1.1 隶属 关系 


定义 一 个 集合 的 基本 属性 是 隶属 关系 (membership)， 它 在 数学 和 英语 中 有 着 相同 直观 
的 意义 。 数 学 家 使 用 符号 xe 5 来 象征 性 地 表示 素 属 关系 ， 它 表示 x 是 集合 S 的 一 个 元 素 。 
例如 ， 根 据 上 节 中 集合 的 定义 ， 下 面 的 语句 是 正确 的 : 
17eN -4eZ neR 
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相反 ， 符 号 x&eS 表示 x 不 是 集合 S 中 的 元 素 。 例 如 ，-4 g N， 因 为 自然 数 集合 不 包括 负数 。 

一 个 集合 的 成 员 通 常 通过 以 下 两 种 方法 来 指定 : 

e 枚 举 法 。 通 过 枚 举 定义 一 个 集合 ,简单 来 说 就 是 列 出 集合 中 的 所 有 元 素 。 按 照 惯 例 ， 
在 集合 列表 中 的 元 素 都 放 在 大 括号 中 并 以 逗号 相隔 。 例 如 ， 单 个 数字 的 自然 数 集合 
可 以 使 用 枚 举 法 定义 如 下 : 

D = (0, 1,2, 3,4, 5,6, 7,8, 9} 

e 规则 法 。 你 可 以 指定 一 个 规则 来 定义 一 个 集合 ， 该 规则 可 以 区 分 集合 中 的 成 员 。 在 
大 多 数 情况 下 ， 规 则 包含 两 部 分 含义 : 作为 一 个 更 大 的 集合 提供 潜在 的 候选 元 素 ; 
作为 一 些 条 件 表达 式 ， 这 些 表达 式 要 求 选 择 的 集合 元 素 必须 满足 这 些 条 件 。 例 如 ， 
前 面 例子 中 的 集合 D 可 以 用 这 种 方法 定义 : 

D= {x|xeN H x«10) 


如 果 你 大 声 读 出 这 个 定义 ， 结 果 听 起 来 应 该 像 这 样 :“D 被 定义 成 所 有 元 素 x 的 集合 ， 
条 件 是 x 为 一 个 自然 数 并 且 x 小 于 10。” 


(03.2 合 运算 


数学 集合 理论 定义 了 集合 中 的 几 种 运算 ， 其 中 ， 下 面 是 几 种 最 重要 的 运算 : 
e 并 (union)。 两 个 集合 的 并 记 为 4UB， 其 结果 为 由 所 有 属于 A 或 B 的 元 素 或 者 同时 
属于 A 和 B 的 元 素 构成 的 集合 。 
{1, 3, 5, 7, 9) U {2, 4, 6, 8} 
(1,254, 8} U 2, 3, 5; 7) = 
{2,3} U {1,2,3,4} = 


e 交 (intersection)。 两 个 集合 的 交 记 为 4nB， 它 包含 同时 属于 4 和 8B 的 元 素 。 739 


{1, 3, 5, 7, 9} N {2,4,6,8} = Ø 
{1, 2, 4, 8}  {2, 3, 5, 7} = {2} 
{2,3} N {1,2,3,4} = (2,3) 
e = (set difference)。 两 个 集合 的 差 记 为 4 一 8， 它 包 含 属于 4 但 不 属于 B 的 元 素 。 


{1,3, 5, 7, 9} — {2, 4, 6, 8} = {1,3,5,7,9} 
{1, 2, 4, 8} — (2,3,5, 7) = (1,4, 8) 
{2,3} - {1,2,3,4} = Ø 
除了 像 并 和 交 这 样 的 集合 运算 外 ， 数 学 集合 理论 也 定义 了 用 于 判定 两 个 集合 是 否 存 在 某 
种 性 质 的 操作 。 测 试 这 种 特定 性 质 的 操作 往往 采用 数学 等 式 的 判定 函数 ， 它 们 通常 被 称 为 关 
X (relation)。 集 合 中 最 重要 的 关系 如 下 : 
e HF (equality). WRES A 和 B 有 相同 的 元 素 ， 则 它们 相等 。 集 合 的 相等 关系 是 
用 标准 的 等 号 表示 的 。 因 此 ， 记 号 A=B 表示 集合 4 和 8B 包含 相同 的 元 素 。 
e FE (subset), FRKABEACB, MRA 中 所 有 的 元 素 都 是 B 中 的 元 素 ， 则 它 是 
正确 的 。 例 如 ,集合 (2, 3, 5, 7} 是 集合 (01, 2, 3, 4, 5,6, 7, 8, 9) 的 一 个 子 集 。 
类 似 地 ， 自 然 数 集合 N 是 整数 集合 Z 的 子 集 。 从 定义 可 以 得 出 : 每 个 集合 显然 都 是 
它 自身 的 子 集 。 数 学 家 使 用 记号 4c B 表示 4 是 B 的 真子 集 (proper subset), ER 
味 着 子 集 关 系 存 在 ,但 两 个 集合 不 相等 。 
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集合 关系 通常 用 韦 恩 图 (Venn diagram) 表示 ， 它 是 以 英国 逻辑 学 家 约翰 cB 
(1834—1923) 的 名 字 命 名 的 。 在 一 个 韦 恩 图 中 ， 单 个 集合 用 几何 图 形 表示 ， 重 到 的 几何 图 
形 表示 它们 共同 元 素 所 在 的 区 域 。 例 如 ， 集 合 运 算 并 、 交 和 差 的 结果 用 下 面 韦 恩 图 中 的 阴影 
区 域 表示 : 
AUB ANB A-B 





17.1.3 ”集合 恒等式 


从 数学 集合 理论 ， 你 会 了 解 到 交 、 并 和 差 操作 在 很 多 方面 相互 关联 。 这 些 关系 通常 表述 

为 恒等式 (identity)， 它 是 表示 两 个 表达 式 恒 等 的 规则 。 在 本 书 中 ， 人 恒等式 采用 以 下 书写 符号 : 
lhs = rhs 

它 意味 着 根据 定义 ， 集 合 表 达 式 lhs 和 rhs 是 相等 的 ， 因 此 ， 它 们 可 以 相互 替换 。 最 常见 的 

集合 恒等式 列 在 表 17-1 中 。 

你 可 以 意识 到 : 当 使 用 画 韦 恩 图 的 方法 表示 计算 的 各 个 阶段 时 ， 这 些 恒 等 式 是 如 何 起 作 
用 的 。 例 如 ， 图 17-1 证 明了 表 17-1 中 的 德 ， 摩根 定律 的 第 一 部 分 ， 这 个 定律 是 以 英国 数学 
家 奥 古 斯 都 . (E - 摩根 的 名 字 命 名 的 ， 他 第 一 个 使 这 些 性 质 形式 化 。 阴 影 区 域 表示 性 质 中 每 
个 子 表达 式 的 值 。 图 17-1 右 侧 的 韦 恩 图 有 相同 的 阴影 区 域 ， 这 个 事实 证 明 集合 4- (BUC) 
和 集合 (4-8) N (4-C) 是 一 样 的 。 


表 17-1 基本 的 集合 恒等式 


SUS=S 


SNS=S EG HE 
"inde scit 
popa, 交换 和 
a "T 
4n (SUC) = ang) U Ane) an 
1- GUC) = (4-3) ^ (4—6) menat 


可 能 你 仍 不 明白 ， 作 为 一 个 程序 员 ， 为 什么 需要 学 习 的 规则 一 眼看 上 去 是 如 此 复杂 和 神 
秘 。 由 于 某 些 原因 ， 数 学 知识 对 于 计算 机 科学 是 很 重要 的 。 首 先 ， 理 论 知 识 自身 确实 是 有 用 
的 ， 因 为 它 能 加 深 你 对 计算 基础 知识 的 理解 。 另 外 ， 这 种 理论 知识 通常 已 经 直接 应 用 到 实际 
编程 中 了 。 

正 是 有 了 这 些 数学 性 质 完 善 的 数据 结构 ， 你 才 可 以 适当 使 用 这 些 结构 的 理论 基础 。 例 
如 ， 如 果 你 使 用 集合 作为 一 种 抽象 类 型 编写 一 个 程序 ， 通 过 应 用 表 17-1 中 的 标准 集合 恒 等 
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式 ， 你 可 以 基于 集合 抽象 理论 来 简化 代码 。 选择 使 用 集合 作为 一 种 编程 抽象 ， 而 不 是 设计 一 
些 属于 你 自己 的 、 但 不 那么 正式 的 结构 ， 可 使 得 你 很 容易 将 这 些 理论 应 用 到 实践 。 


4 BUC A-(BUC) 






图 17-1 用 韦 恩 图 来 展示 部 分 德 摩根 定律 


17.2 ”集合 接口 的 扩展 


尽管 你 已 经 在 本 书 集合 类 的 论述 中 遇 到 过 Sec 类 ,但 Stanford 类 库 中 的 set.h $E 
口 提 供 了 一 组 更 丰富 的 方法 ， 以 及 第 S 章 未 描述 的 一 些 扩展 的 操作 符 。 或 许 更 重要 的 是 ， 
Stanford 类 库 中 关于 sec 类 的 实现 包含 了 几 种 方法 (它们 在 Stanford 模板 库 中 是 不 可 使 用 
的 ) 来 实现 高 级 的 集合 运算 ,例如 ， 求 子 集 、 相 等 判断 、 并 、 交 和 差 。 该 接口 的 扩展 版 本 显 


示 在 图 17-2 中 。 


/* 
File: set.h 


This interface exports the Set class, a collection for storing a set 
of distinct elements. 


ky 


#ifndef _set_h 
#define set h 


#include "map.h" 
#include "vector.h" 


* This template class stores a collection of distinct elements. 


xy 


template «typename ValueType> 
class Set ( 
public: 


/* 
* Constructor; Set 
* Usage: Set<ValueType> set; 





图 17-2 Set 类 的 接口 
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RATE 


initializes an empty set of the specified value 


ali 


Set(); 


/* 
* Destructor: -Set 


* Frees any heap storage associated 
*7 


~Set () ; 


Method: size 
Usage: int count set.size(); 


Returns the number of elements in 
27 


int size() const; 


Method: isEmpty 
Usage: if (set.isEmpty()) 


Returns true if this set contains 


“7 
bool isEmpty() const; 


/* 
* Method: add 
Usage: set.add(value); 


Adds an element to this set if it 
47 


void add(const ValueType & value); 


Method: remove 

Usage: set.remove(value); 

Removes an element from this set. 
set, the set remains unchanged. 


/ 


void remove(const ValueType & value); 


Method: contains 
Usage: if (set.contains(value)) 


Returns true if the specified value is in this set 


bool contains(const ValueType & value) const; 


Method: clear 
Usage: set.clear(); 


Removes all elements from this set. 


void clear(); 


Method: isSubsetOf 
if (set .isSubsetOf (set2)) 


Implements the subset relation for sets. 
if every element of this set is contained in set2. 


bool isSubsetOf(const Set & set2) const; 


17-2 (4) 


no elements. 


is not already there. 


If the value was not 


This method returns true 





contained in the 
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Returns true if setl and set2 contain the same elements. 


Raj 


bool operator--(const Set & set2) const; 


Operator: l= 
Usage: setl !- set2 


Returns true if setl and set2 are different. 


ay 


bool operator!-(const Set & set2) const; 


* Operator: + 
Usage: setl + set2 
setl * value 


Returns the union of sets setl and set2, which is the set of elements 
that appear in at least one of the two sets. The second form returns 
the set formed by adding a single element. 


Set operator+(const Set 5 set2) const; 
Set operator+(const ValueType & value) const; 


* Operator: * 
* Usage: setl * set2 


* Returns the intersection of sets setl and set2, which is the set of 
* elements that appear in both. 
*/ 


Set operator*(const Set & set2) const; 


Operator: - 
* Usage: setl - set2 
setl - value 


Returns the difference of sets setl and set2, which is all the 
* elements that appear in setl but not set2. The second form returns 
the set formed by removing a single element. 


Set operator-(const Set & set2) const; 
Set operator-(const ValueType & value) 


Operator: *- 
Usage: setl += set2; 
setl += value; 


Adds all elements from set2 (or the single specified value) to setl. 


Set & operator4-(const Set & set2); 
Set & operator+=(const ValueType & value); 


Operator: *= 
Usage: setl *- set2; 


Removes any elements from setl that are not present in set2. 


Set & operator*=(const Set 5 set2); 
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/* 

* Operator: 一 = 

* Usage: setl -= set2; 
setl -- value; 


* Removes all elements from set2 (or a single value) from setl 


ag 


Set & operator--(const Set & -set2); 
Set & operator--(const ValueType & value); 


The private section of the class goes here. 


The implementation of the class goes here. 





图 17-2 (#8) 


包含 高 级 方法 和 操作 符 的 Set 类 使 得 基于 集合 的 算法 非常 容易 理解 ， 主 要 是 因为 这 些 
算法 的 实现 最 终 看 起 来 与 它们 的 数学 公式 很 像 。 这 个 事实 尤其 与 第 18 章 将 论述 的 图 有 关 。 
图 算法 是 最 重要 的 ， 而 且 对 于 聪明 的 程序 员 是 最 有 吸引 力 的 ， 你 将 从 本 书 中 学 到 该 算法 。 我 
们 在 斯 坦 福 的 教学 经 验 表明 ， 如 果 代 码 使 用 扩展 的 set 类 的 高 级 操作 符 ， 那么 学 习 这 些 算 
法 将 会 非常 容易 。 

在 集合 类 中 增加 并 、 交 和 差 操作 符 需 要 在 设计 中 深入 思考 。U 和 站 符号 没有 显示 在 标准 
键盘 上 ， 这 个 事实 暗示 着 它 将 会 聪明 地 使 用 更 多 的 习惯 性 符号 用 于 这 些 运算 。 虽 然 C++ ft 
许 程 序 员 扩 展 操作 符 集合 ， 但 C++ 限制 使 用 重 载 现 有 的 操作 符 ， 这 意味 着 有 必要 从 C++ 已 
经 定义 的 操作 符 中 选择 合适 的 符号 来 表示 集合 类 的 各 种 高 级 运算 。 尽 管 并 和 差 运算 已 经 用 操 
作 符 + 和 - 直观 地 表示 ， 但 是 选择 一 个 操作 符 表示 交 运 算 仍 有 点 困难 。 

尽管 Stanford 类 库 中 set .h 接口 的 设计 者 考虑 了 其 他 的 可 能 性 ， 在 该 类 库 关 于 set 类 
的 实现 中 ， 它 采用 * 表示 集合 交 运 算 。* 操作 符 在 布尔 代数 的 论述 中 经 常 被 用 于 这 种 目的 ， 
主要 因为 值 0 和 1 乘法 运算 的 结果 表示 交 运 算 更 有 说 服 性 : 


正如 二 进 制 乘法 表 所 示 的 ， 只 有 当 输 入 的 两 个 值 都 是 1 时 ， 产 生 的 值 才 是 1。 使 用 一 种 类 似 
的 方法 ， 只 有 当 一 个 元 素 同 时 是 两 个 集合 的 成 员 时 ， 它 才 在 集合 的 交集 中 。 

重新 定义 操作 符 +、* 和 -， 显 然 会 使 用 户 认为 他 们 也 可 以 使 用 简写 的 赋值 操作 符 +=、 
*= 和 -=。 因 此 ， 扩 展 的 set .h 接口 也 包含 这 些 操作 符 。 而 且 ， 这 些 操作 符 将 一 个 集合 或 
单个 元 素 作为 其 右 操作 数 ， 例 如 ， 通 过 书写 下 面 的 表达 式 将 值 v 添加 到 集合 s 中 : 


s += v; 


17.39 ”集合 的 实现 策略 
和 映射 的 情况 相似 ， 实 现 Set 类 通常 有 两 种 策略 。Stanford 模板 库 的 设计 者 选择 的 方 


E: A 501 


法 是 使 用 一 棵 平衡 二 又 树 作 为 基本 表示 。 然 而 ， 其 他 编程 语言 通常 采用 哈 希 策略 来 实现 Set 
类 ,， 它 的 效率 稍微 高 一 点 。 使 用 平衡 二 又 树 最 主要 的 优点 是 : 我 们 很 容易 以 事先 排列 好 的 顺 
序 遍 历 集合 中 的 元 素 。 

Jave 语言 通过 提供 TreeSet fll HashSet 类 以 尽量 满足 尽 可 能 多 的 用 户 需 求 。Stanford 
类 库 中 的 Set 类 对 应 着 STL 库 的 TreeSet 类 的 实现 方法 ,但 是 STL 库 也 提供 了 Hashset 
类 ,在 习题 5 中， 你 将 有 机 会 实现 它 。 

好 消息 是 只 要 你 利用 已 经 拥有 的 类 ，TreeSet 和 HashSet 类 用 C++ 语言 都 很 容易 实 
现 。 开 发 一 个 简单 的 实现 的 根本 点 在 于 集合 和 映射 本 质 上 是 相同 的 。 你 可 以 使 用 Map 类 很 
容易 地 创建 set 类 。 如 果 你 采用 这 种 策略 ，set 类 除了 一 个 包含 Map 类 的 单个 的 实例 变量 
外 ,不 需要 任何 东西 ， 如 图 17-3 所 示 。 映 射 中 的 值 域 被 忽略 了 ， 通 过 检测 一 个 关键 字 是 否 
存在 于 Map 中 可 以 确定 键 与 值 的 关系 。 然 而 ，Set 类 需要 一 个 值 域 。 图 17-3 中 的 注释 表示 : 
这 种 实现 使 用 bool 作为 值 类 型 表示 一 个 特定 的 元 素 在 或 不 在 集合 中 。 


* 
* Notes on the representation 
* 


* This implementation of the Set class uses a map as its underlying 

* data structure. The value field in the map is ignored, but is 

* declared as a bool to suggest the presence or absence of a value. 

* The fact that this class is layered on top of an existing collection 
* makes it substantially easier to implement. 


wy 
private: 
/* Instance variables */ 


Map«ValueType,bool» map; /* Map Used to store the elements */ 





图 17-3 Set 类 的 私有 部 分 


就 其 他 方面 而 言 ， 当 你 定义 一 个 抽象 时 (正如 在 当前 使 用 映射 实现 集合 的 建议 中 )， 最 
终 的 抽象 被 认为 是 分 层 的 real 分 层 抽象 有 许多 优点 。 首 先 ， 它 们 容易 实现 ， 因 为 许 
多 工作 可 以 和 已 有 的 低级 接口 联系 起 来 。 

基于 映射 而 分 层 地 实现 集合 的 策略 ， 就 其 本 身 而 言 ， 对 编写 Set 类 的 相关 代码 是 不 够 
的 ，Set 类 提供 了 各 种 各 样 的 高 级 操作 ， 而 它们 不 属于 Map 类 的 一 部 分 。 然 而 ， 这 种 策略 
确实 提供 了 一 个 好 的 开始 。 另 外 ， 高 级 的 运算 容易 使 用 已 有 的 Map 类 的 功能 来 实现 。Set 
类 中 的 操作 符 代码 见 图 17-4。 


Sp ee ion notes: Set constructor and destructor 
* The constructor and destructor are empty because the Map class manages 
* the underlying representation. 
£z 
template «typename ValueType» 


Set«ValueType»::Set() ( 
/* Empty */ 


) 


template «typename ValueType» 
Set«ValueType»::-Set() ( 
/* Empty */ 
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/* 


* Implementation notes: size, isEmpty, add, remove, contains, clear 


* These methods forward their operation to the underlying Map object 
*/ 


template «typename ValueType> 
int Set«ValueType»::size() const ( 
return map.size(); 


) 


template «typename ValueType> 

bool Set«ValueType»::isEmpty() const ( 
return map.isEmpty(); 

} 


template <typename ValueType> 
void Set«ValueType»::add(const ValueType & value) { 
map.put(value, true); 


template «typename ValueType» 
void Set«ValueType»::remove(const ValueType & value) ( 
map.remove (value); 


) 


template «typename ValueType» 
bool Set«ValueType»::contains(const ValueType & value) const { 
return map.containsKey (value); 


) 


template «typename ValueType» 
void Set«ValueType»::clear() ( 
map.clear(); 


) 


Implementation notes: isSubset 


This method simply checks to see whether each element of the current 
set is an element of set2. 


template «typename ValueType» 
bool Set«ValueType»::isSubsetOf(const Set & set2) const ( 
for (ValueType value : map) { 
if (!set2.contains(value)) return false; 


) 


return true; 


Implementation notes: operator--, operator!- 


These operators make use of the fact that two sets are equal only 
if each set is a subset of the other. 


template <typename ValueType> 
bool Set<ValueType>: :operator==(const Set & set2) const ( 
return isSubsetOf(set2) && set2.isSubsetOf(*this); 


) 


template «typename ValueType> 
bool Set«ValueType»::operator!-(const Set & set2) const { 
return !(*this -- set2); 


) 


Implementation notes: operator+ 


The union operator copies the current set and then adds the elements 
from set2 to the result. 





图 17-4 (#8) 
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template «typename ValueType> 
Set«ValueType» Set«ValueType»::operator*(const Set & set2) const ( 
Set«ValueType» set - *this; 
for (ValueType value : set2.map) ( 
set.add(value); 
) 


return set; 


Set«ValueType» Set<ValueType>::operator+(const ValueType & value) const { 
Set«ValueType» set - *this; 
set.add(value); 
return set; 


Implementation notes: operator* 


The intersection operator adds elements to an empty set only if they 
appear in both sets. 


template «typename ValueType> 
Set«ValueType» Set«ValueType»::operator*(const Set & set2) const ( 
Set«ValueType» set; 
for (ValueType value : map) ( 
if (set2.contains(value)) set.add(value); 
) 


return set; 


Implementation notes: operator- 


* The set difference returns a new set consisting of the elements in 
* the current set that do not appear in set2. 
*/ 


template «typename ValueType> 
Set«ValueType» Set«ValueType»::operator- (const Set & set2) const { 
Set«ValueType» set; 
for (ValueType value : map) ( 
if (!set2.contains(value)) set.add(value); 


) 


return set; 


} 


template <typename ValueType> 

Set«ValueType» Set«ValueType»::operator-(const ValueType & value) const { 
Set«ValueType» set - *this; 
set.remove (value); 
return set; 


Implementation notes: shorthand assignment operators 


These operators modify the current set but are otherwise similar to 
the operators that create new sets. The only subtlety is that the 
intersection operator must create a vector of elements that need to be 
removed to avoid changing the set while cycling through its elements. 


/ 


template «typename ValueType» 
Set«ValueType» 5 Set<ValueType>: :operator+=(const Set 5 set2) ( 
for (ValueType value : set2.map) ( 
add(value); 


) 


return *this; 


) 


template «typename ValueType» 


Set«ValueType» & Set<ValueType>: :operator+=(const ValueType & value) { 
add(value); 
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return *this; 


) 


template <typename ValueType> 
Set«ValueType» & Set<ValueType>: :operator*=(const Set & set2) { 
Vector<ValueType> toRemove; 
for (ValueType value : map) { 
if (!set2.contains(value)) toRemove.add(value) ; 
} 
for (ValueType value : toRemove) { 
remove (value) ; 


return *this; 


} 


template <typename ValueType> 
Set<ValueType> & Set«ValueType»::operator--(const Set & set2) { 
' for (ValueType value : set2.map) { 
remove (value); 


return *this; 


) 


template «typename ValueType» 

Set«ValueType» 5 Set«ValueType»::operator-- (const ValueType & value) ( 
remove (value); 
return *this; 





图 17-4 ( 续 ) 


17.4 优化 小 整数 的 集合 
上 一 节 的 set 类 实现 策略 适用 于 任何 值 类 型 。 然 而 ， 这 个 实现 策略 可 以 进行 非常 大 的 
改进 ， 集 合 的 元 素 值 可 采用 小 整数 类 型 ， 例 如 枚 举 类 型 或 字符 类 型 。 


17.4.1 ”特征 向 量 


暂且 假设 你 正在 使 用 一 个 集合 ， 其 中 的 元 素 值 总 是 在 0 和 RANGE SIZE-1 之 间 ， 
RANGE_SIZE 是 一 个 常量 ， 以 表明 元 素 值 的 约束 范围 ， 你 可 以 使 用 拥有 布尔 值 的 数组 来 
有 效 地 表示 这 样 的 集合 。 数 组 索引 位 置 k 处 的 值 表示 整数 k 是 否 在 集合 中 。 例 如 ， 如 果 
elements [4] Hier true， 那 么 4 在 集合 中 通过 布尔 数组 elements 表示 。 类 似 地 ， 如 
果 elements[5] 的 值 为 false，5 就 不 是 该 集合 的 元 素 。 

"iei sed 每 个 元 素 的 索引 与 某 个 集合 的 元 素 值 存在 着 一 一 对 应 的 关系 ， 则 
这 样 的 布尔 数组 被 称 为 特征 向 量 (characteristic vector)。 下 面 的 例子 展示 了 采用 这 种 特征 向 
量 策 略 来 表示 的 若干 集合 ， 假 设 RANGE SIZE 的 值 为 10: 


eo 
EEEEETEEERIE 
[1, 3, 5, 7, 9] 
iiri || xiv ej 


(2, 3, 5,7} 
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使 用 特征 向 量 策略 的 优点 是 我 们 能 够 以 常量 时 间 实 现 add, remove fll contains 操 
作 。 例 如 ， 为 了 将 元 素 k 添加 到 集合 中 ， 需 要 将 特征 向 量 中 索引 位 置 k 处 的 元 素 值 设置 为 
true。 类 似 地 ， 测 试 全 体 成 员 就 是 简单 地 选择 集合 中 合适 元 素 的 问题 。 


17.4.2 ”压缩 的 位 数组 


虽然 采用 特征 向 量 策 略 可 使 算法 获得 高 效 的 运行 时 间 ， 但 将 特征 向 量 用 数组 表示 仍 需 要 
大 量 的 内 存 ， 特 别 是 当 RANGE SIZE 较 大 时 。 为 了 降低 所 需 的 存储 空间 ， 你 可 以 将 特征 向 
量 元 素 压 缩 到 机 器 字 中 ， 使 机 器 字 中 的 每 一 位 与 特征 向 量 的 每 一 位 相对 应 。 例 如 ， 假 设 类 型 
unsigned long 在 你 机 器 上 是 32 位 。 既 然 特征 向 量 中 的 每 个 元 素 只 需要 一 比特 信息 ， 那 
么 你 就 可 以 用 一 个 单独 的 unsigned long 类 型 的 值 存储 一 个 有 32 个 元 素 的 特征 向 量 。 另 
外 ， 如 果 RRANGE SIZE 的 值 是 256， 你 可 以 将 一 个 特征 向 量 所 需 的 所 有 的 256 个 比特 存储 
在 一 个 拥有 8 个 unsigned long 值 的 数组 中 。 

为 了 理解 特征 向 量 如 何 被 压缩 成 一 个 具有 机 器 字 的 数组 ， 想 象 一 下 你 想 表示 包含 关于 
字母 表 字 符 的 ASCH 码 的 整数 集合 。 该 集合 包含 26 个 大 写字 母 ，ASCII 码 值 在 65 一 90 之 
间 ; 42% 26 个 小 写字 母 ，ASCII 码 值 在 97 一 122 之 间 。 因 此 ， 它 可 以 编码 成 下 面 的 特征 


向 量 : 





31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 1$ 14 I3 12 44 10 9 8 7 


如 果 你 想 找到 对 应 于 特定 整数 值 的 比特 ， 最 简单 的 方法 是 使 用 整数 除法 和 取 模 运算 。 例 
如 ,假设 你 想 定位 对 应 于 字符 'x' 的 比特 ， 它 的 ASCII 码 值 为 88。 所 求 比特 的 行 数 是 2, 
因为 每 一 行 有 32 个 比特 ， 并 且 根 据 标准 的 整数 除法 定义 ，88/32 的 结果 为 2。 类 似 地 ， 在 第 
2 行 ， 你 找到 了 'x' 记录 在 24 比特 处 ， 它 是 88 除 以 32 的 余数 。 因 此 ， 在 特征 向 量 中 ， 对 
应 于 字符 'x' 的 比特 在 下 面 图 中 加 黑 的 位 置 : 





加 黑 的 位 是 1， 这 表明 ' x' 是 集合 中 的 一 个 成 员 。 
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17.4.83 ”位 操作 符 


为 了 编写 能 处 理 这 种 压缩 的 位 数组 数据 的 代码 ， 你 必须 学 习 如 何 使 用 低级 的 由 C++ 提 
供 的 用 于 操作 内 存 位 的 位 操作 符 ( bitwise operator)， 如 表 17-2 所 示 。 这 些 操作 符 读 取 任 意 
的 标量 类 型 值 并 将 它们 翻译 成 与 底层 硬件 相对 应 的 比特 序列 表示 。 

为 了 说 明 位 操作 符 的 功能 ， 让 我 们 考虑 一 个 特定 的 例子 。 假 设 在 一 台 机 器 上 ， 变 量 x 和 
y 已 经 被 声明 为 具有 16 个 比特 的 short 类 型 ， 如 下 所 示 : 


unsigned short x = 0x002A; 
unsigned short y = OxFFF3; 


正如 第 11 章 所 描述 的 ， 如 果 你 将 初始 值 从 十 六 进 制 转换 为 二 进 制 ， 很 容易 就 能 确定 变量 x 
Al y 的 比特 模式 ， 其 比特 模式 如 下 图 所 示 : 


y hlofof ya] 
&、| 和 ^ 操作 符 的 语义 如 表 17-2 所 示 ， 其 中 的 每 一 个 操作 符 都 作用 于 操作 数 的 所 有 比特 
位 。 例 如 ，& 操作 符 产生 了 一 个 结果 ， 即 只 有 当 两 个 操作 数 对 应 的 比特 位 都 为 1 时 ， 其 对 应 
的 结果 数 的 比特 位 为 1。 因 此 ， 如 果 将 操作 符 应 用 到 x y 的 比特 模式 中 ， 你 将 得 到 以 下 


结果 : 
xsy |ololololololololololijojololio 
表 17-2 C++ 的 位 操作 符 
x&y 逻辑 与 。 当 x 和 ?对 应 的 比特 位 均 为 1 时 ， 结 果 比 特 位 为 1 
x|y WHA, 24 x Aly 对 应 的 比特 位 只 要 有 一 个 为 1 时 ， 结 果 比 特 位 为 1 
x^y 逻辑 异 或 。 当 x My 对 应 的 比特 位 值 不 同时 ， 其 结果 比特 位 为 1 
~x 逻辑 非 。 将 x 的 各 比特 位 取 反 ， 若 为 0 时 ， 结 果 为 1， 反 之 亦 然 
x««n 左 移 。 将 x 向 左 移 n 个 比特 位 
x>>n AB. x MAB n 个 比特 位 
| 和 ^ 操作 符 产 生 了 以 下 结果 : 
xiy niii psnnnpnpppnnenT 
x^y [1i o hlel] 


~ 操作 符 为 一 元 操作 符 ， 它 将 操作 数 的 每 一 位 取 反 。 例 如 ， 如 果 你 将 ~ 操作 符 应 用 到 x 
的 比特 模式 中 ， 结 果 看 起 来 如 下 图 所 示 : 


x Liilolilolol 
在 编程 中 ，~ 操作 是 取 操 作 符 后 面 的 单个 操作 数 的 反 码 ， 因 此 ， 这 一 操作 被 称 为 取 反 


(taking the complement) 。 


操作 符 << 和 >> 是 移动 其 左 操作 数 的 比特 位 ， 移 动 的 位 数 由 右 操作 数 指定 。 这 两 个 
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操作 的 唯一 区 别 是 移动 的 方向 。<< 操作 符 将 比特 串 左 移 ; 而 >> 操作 符 将 比特 串 右 移 。 因 
lt, KAR x<<1 产生 了 一 个 新 的 值 ， 其 中 , 值 x 的 每 一 比特 向 左 移动 了 一 个 位 置 ， 如 下 图 
所 示 : 


x lolololololololololof fof lolol 
*<<1 [lololololololololol fof lolrlolo] 


KM, KAR y>>2 产生 了 一 个 值 ， 其 中 , (8 y 的 每 一 比特 向 右 移动 了 两 个 位 置 ， 如 下 图 


所 示 : 
Yo 
y>>2 [lolol [a[i lalala iif oo] 


只 要 被 移动 的 值 是 无 符号 的 ， 显 示 在 字 结 尾 的 被 移动 的 比特 数字 消失 ， 并 且 在 另 一 端 用 
比特 0 代替。 如 果 被 移动 的 值 是 有 符号 的 ， 移 动 操作 符 的 行为 依赖 于 硬件 的 基本 特征 。 由 于 
这 个 原因 ， 在 实际 中 你 要 约束 对 无 符号 类 型 值 使 用 移动 操作 符 ， 从 而 提高 代码 的 可 移植 性 。 


1744 ”实现 特征 向 量 


在 上 节 介 绍 的 位 操作 符 使 我 们 可 以 使 用 一 种 极其 有 效 的 方式 来 实现 特征 向 量 上 的 操作 。 
如 果 要 测试 特征 向 量 上 一 个 单独 比特 的 状态 ， 你 需要 创建 一 个 值 ， 在 期 望 的 位 置 设 比特 为 
1， 其 余 的 位 置 是 比特 0。 这 样 的 值 被 称 为 撩 码 〈《mask)， 因 为 它 掩盖 了 字 中 其 他 所 有 的 比特 
位 而 得 名 。 如 果 你 将 & 操作 符 应 用 到 表示 特征 向 量 的 字 中 ， 其 中 包含 了 你 正在 试图 寻找 的 比 
特 位 和 对 应 于 正确 比特 位 置 的 掩 码 ， 字 中 其 他 所 有 的 比特 都 被 去 除了 ， 只 留 下 反映 预期 比特 
状态 的 值 。 

为 了 使 这 个 策略 更 具体 ， 更 深入 地 思考 一 个 特征 向 量 的 底层 表示 是 很 有 帮助 的 。 下 面 的 
代码 将 特征 向 量 CharacteristicVector 定义 为 一 个 结构 ， 它 包含 了 一 个 被 翻译 成 比特 
序列 的 字数 组 。 

struct CharacteristicVector { 


unsigned long words[CVEC WORDS]; 
}; 


HH, CVEC_WORDS 是 一 个 常量 ， 定 义 如 下 : 


const int BITS PER BYTE = 8; 

const int BITS PER LONG = BITS PER BYTE * sizeof(long); 

const int CVEC WORDS = (RANGE SIZE * BITS PER LONG - 1) 
/ BITS PER LONG; 


给 定 这 个 结构 ， 你 可 以 使 用 函数 testBit 来 测试 一 个 特征 向 量 中 的 特定 比特 位 ， 该 函数 的 
实现 如 下 所 示 : 


bool testBit(CharacteristicVector & cv, int k) ( 
if (k« 0 || k >= RANGE SIZE) ( 
error("testBit: Bit index is out of range"); 
) 
return cv.words[k / BITS PER LONG] & createMask(k); 
) 
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) 
unsigned long createMask(int k) { 


return unsigned long(1) «« k * BITS PER LONG; 
) 


例如 ,假设 你 调用 testBit (cv, 'x' )， 其 中 cv 是 对 应 于 字母 表 的 字符 集合 的 特征 向 
量 。 正 如 在 本 章 前 一 节 中 所 讲述 的 ，cv 特征 向 量 看 起 来 如 下 图 所 示 : 


Eo 
ol 
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函数 testBit 开始 通过 计算 以 下 表达 式 来 选择 查询 所 对 应 的 特征 向 量 中 合适 的 字 : 


cv.words[k / BITS PER LONG]; 


下 标 表 达 式 k/BITS_PRE_LONG 对 应 着 特征 向 量 的 第 k 个 比特 位 所 在 的 字 的 位 置 。 由 于 字 
ff'x' 的 ASCII 码 值 是 88， 且 BITS_PER_LONG 是 32， 上 述 下 标 表 达 式 的 结果 为 2， 即 
选择 索引 位 置 为 2 的 字 ， 该 字 包 含 以 下 比特 : 


ololololof da 


函数 createMask(k) 产生 一 个 在 合适 位 置 包含 比特 1 的 掩 码 。 例 如 ， 如 果 k 的 值 为 
88, k$BITS PER LONG 是 24， 它 意味 着 掩 码 包含 的 值 1 左 移 了 24 个 比特 位 置 ， 如 下 图 
所 示 : 

[ofolofolofolof [ofololololololololololololololololololololololo, 

因为 掩 码 只 有 一 个 比特 1， 只 有 当 特 征 向 量 中 相应 的 比特 数字 是 1 时 ， 代 码 中 关于 
testBit 的 & 操作 符 才 会 返回 一 个 非 零 值 。 如 果 特 征 向 量 在 那个 位 置 包含 一 个 0， 将 没有 
比特 是 向 量 和 掩 码 所 共有 的 ， 这 意味 & 操作 符 将 会 返回 只 包含 比特 0 的 字 。 一 个 完全 由 比 
特 0 组 成 的 字 的 整数 值 为 0。 

使 用 掩 码 策 略 也 使 我 们 很 容易 操作 特征 向 量 中 单独 比特 的 状态 。 根 据 惯例 ;将 值 1 赋 
给 一 个 指定 的 比特 被 称 为 设置 (setting) 比特 ; 赋值 0 被 称 为 清空 ( clearing) 比特 。 你 可 以 
通过 使 用 逻辑 OR 操作 符 同时 将 掩 码 某 位 置 1 使 一 个 字 的 旧 值 指定 位 置 1。 你 也 可 以 通过 将 
逻辑 AND 操作 符 应 用 到 字 的 旧 值 和 掩 码 的 补 码 中 。 下 面 的 关于 函数 setBit 和 clearBit 
的 定义 展示 了 这 些 操作 : 


void setBit(CharacteristicVector & cv, int k) ( 
if (k« 0 || k >= RANGE SIZE) ( 
error("setBit: Bit index is out of range"); 
) 
cv.words[k / BITS PER LONG] |= createMask (k); 
) 


void clearBit(CharacteristicVector & cv, int k) ( 
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if (k < 0 || k >= RANGE SIZE) { 
error("setBit: Bit index is out of range"); 
} 
cv.words[k / BITS PER LONG] &= ~createMask (k); 
} 


1745 “实现 高 级 集合 运算 

将 特征 向 量 压缩 成 机 器 字 中 的 比特 位 节省 了 大 量 的 内 存 空 间 。 同 时 ， 这 种 策略 也 能 改善 
并 、 交 和 集合 差 这 些 高 级 的 集合 操作 的 效率 。 其 技巧 是 通过 使 用 一 个 单独 的 合适 位 操作 符 来 
计算 新 的 特征 向 量 中 的 每 个 字 。 

例如 ， 两 个 集合 的 并 集 包 含 属于 任何 两 个 集合 之 一 的 所 有 元 素 。 如 果 你 把 这 个 想法 应 用 
到 特征 向 量 ， 就 很 容易 明白 : 通过 采用 逻辑 OR 操作 符 ， 特 征 向 量 集合 AUB 中 的 每 个 字 都 
进行 了 或 运算 。 进 行 逻辑 OR 运算 使 得 集合 A 和 B 所 对 应 的 比特 位 若 有 一 个 为 1， 则 相应 比 
特 位 结果 为 1， 这 正 是 你 所 需要 计算 的 并 集 。 


17.4.6 ”模板 特 化 

就 空间 和 时 间 而 言 ， 特 征 向 量 模型 允许 字符 集合 比 一 般 的 集合 实现 起 来 效率 更 高 。 尽 管 
在 效率 上 有 所 区 别 ， 但 是 它 对 于 用 户 学 习 两 种 不 同 的 集合 模型 (一 种 是 字符 集合 ， 另 一 种 是 
元 素 类 型 为 任意 的 集合 ) 是 没有 影响 的 。 你 需要 定义 两 个 模板 类 的 实现 ， 然 后 让 编译 需 来 确 
定 集合 元 素 的 类 型 。 

C++ 允许 定义 类 模板 。 你 可 以 指定 一 个 带 有 一 个 或 者 多 个 具有 更 通用 类 型 的 模板 参数 
的 类 模板 。 这 种 技术 被 称 为 模板 特 化 ( template specialization )。 如 果 用 户 提供 的 实 参 类 型 与 
模板 参数 类 型 相 匹 配 ， 则 编译 器 就 会 使 用 模板 的 实 参 类 型 从 类 模板 中 特 化 出 一 个 具体 的 模 

作为 一 个 例子 ,假设 你 想 定义 (你 将 有 机 会 在 习题 8 中 遇 到 ) 一 个 采用 字符 特征 向 量 来 
存储 数据 的 类 set<char> 的 特 化 实现 ，set<char> 类 采用 字符 特征 向 量 来 存储 数据 。 该 
类 的 接口 如 下 所 示 : 


template <> 
class Set<char> { 
class body for character sets 


}; 
模板 后 的 一 对 空 的 尖 括 号 告诉 编译 器 Set 类 的 这 个 版 本 仍 被 定义 为 一 个 模板 ,但 是 不 允许 
用 户 指 定 模板 参数 类 型 。set 类 的 这 个 版 本 的 值 类 型 总 是 char 类 型 。 同 样 的 语法 应 用 于 具 
体 化 类 的 方法 的 实现 中 。 因 此 ，set 类 的 构造 函数 有 以 下 结构 : 

template <> 

Set<char>::Set { 

implementation of the character set constructor 

) 
Set«char» 类 的 私有 部 分 和 实现 与 更 一 般 的 Set<ValueType> 肯定 是 不 同 的 ， 因 为 它们 
使 用 不 同 的 数据 模型 。 然 而 ， 理 想 的 情况 是 它们 的 接口 应 该 是 相同 的 。 


17.4.7 ”使 用 一 种 混合 的 实现 
预定 义 的 char 类 型 只 有 256 个 可 能 的 值 。 这 个 事实 使 得 我 们 很 容易 使 用 一 个 特征 向 量 
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作为 底层 表示 ， 因 为 该 向 量 只 需要 256 个 比特 的 存储 空间 。 但 是 如 果 你 想 借 用 类 set<int> 
来 实现 字符 特征 向 量 ， 将 会 发 生 什 么 呢 ? 在 一 个 使 用 32 位 整数 的 机 器 上 ， 一 个 整数 特征 向 
量 将 需要 2 ”个 比特 ， 这 对 于 字符 类 型 的 特征 向 量 是 不 合适 的 。 

即使 特征 向 量 不 能 表示 所 有 的 整数 集合 ， 但 只 要 集合 中 的 值 在 一 个 有 限 的 范围 内 ， 
它们 仍然 很 有 有用。 你 必须 设计 一 种 数据 结构 ， 要 求 只 要 整数 较 小 ， 数 据 结构 就 使 用 特 
征 向 量 , 但 是 如 果 一 个 用 户 尝试 存储 一 个 超出 范围 的 值 ， 数 据 结构 就 应 转 到 更 通用 的 
二 叉 树 实现 方法 上 。 最 后 ， 用 户 只 使 用 在 约束 范围 内 的 整数 就 能 得 到 增强 性 能 的 特征 
向 量 策略 。 然 而 ， 若 用 户 需 要 定义 包含 最 佳 范围 之 外 的 整数 的 集合 ， 也 可 以 使 用 相同 的 
接口 。 


本 章 小 结 


在 本 章 ， 你 已 经 学 习 了 关于 集合 的 知识 ， 作 为 一 个 理论 和 实践 的 抽象 ， 这 对 于 计算 机 科 
学 是 很 重要 的 。 集 合 有 着 坚实 的 数学 基础 (完全 不 会 使 它们 太 抽 象 以 至 于 没有 作用 )， 使 它 
作为 一 个 编程 工具 有 更 多 的 效用 。 因 为 集合 深厚 的 理论 基础 ， 你 可 以 依靠 集合 所 表现 的 特定 
性 质 并 遵守 其 特定 的 规则 。 通 过 编写 关于 集合 的 算法 ， 你 可 以 在 集合 理论 的 基础 上 编写 出 更 
易 用 于 理解 的 程序 。 

本 章 的 重点 包括 : 

e 一 个 集合 是 一 个 无 序 的 不 同 元 素 的 容器 。 本 书 使 用 的 集合 运算 以 及 它们 的 数学 符号 

见 表 17-3. 

e 如 果 你 牢记 集合 运算 的 恒等式 ， 那 么 在 遇 到 各 种 各 样 的 集合 运算 时 一 般 很 容易 理解 。 

使 用 这 些 恒 等 式 也 能 提高 你 的 编程 实践 能 力 ， 因 为 它们 给 你 提供 了 用 来 简化 代码 中 
合 运算 的 工具 。 

集合 类 很 容易 实现 ， 因 为 它们 大 多 在 Map 类 之 上 分 层 ， 使 用 基于 树 或 基于 哈 希 表 的 
表示 方式 。 

使 用 称 为 特征 向 量 的 布尔 数组 能 够 有 效 实现 整数 集合 。 如 果 你 采用 C++ 提供 的 位 操 
作 符 ， 可 以 将 特征 向 量 压缩 成 少量 的 机 器 字 ， 并 且 同 时 在 向 量 中 的 许多 元 素 上 实现 
如 并 和 交 这 样 的 集合 运算 。 


表 17-3 ”有关 集 合 的 数学 记号 汇总 


空 集 | 集合 不 包含 任何 元 素 

集合 成 员 xes 如 果 x 是 集合 5 的 一 个 元 素 ， 为 丰 

非 集合 成 员 如 果 x 不 是 8 的 一 个 元 素 ， 为 丰 

相等 A=B 如 果 4 和 及 包含 完全 相同 的 元 素 ， 为 真 

子 集 如 果 4 中 所 有 的 元 素 都 在 了 中 ， 为 丰 

真子 集 ACB 如 果 4 是 B 的 子 集 并 且 两 集合 不 相等 ， 为 真 

并 集 要 么 在 4 中 ,要么 在 中， 要么 同时 在 4 和 B 中 
交集 集合 中 的 元 素 同时 在 集合 4 和 8 中 

集合 差 集 集合 中 的 元 素来 自 于 A 集合 但 不 能 包含 B 中 的 元 素 
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复习 题 
1. 判断 题 : 集合 中 的 元 素 是 无 序 的 ， 所 以 集合 (3,2, 1) 和 集合 {1, 2, 3} 表示 相同 的 集合 。 
2. 判断 题 ， 一 个 集合 可 以 包含 多 个 同一 元 素 的 拷贝 。 
3. 符 号: Ø, Z. N 和 R 指 的 是 什么 集合 ? 
4. 符号 E 和 分 别 表示 什么 含义 ? 
5. 使 用 枚 举 法 来 描述 下 面 集合 中 的 元 素 : 
{x|xeN H x<100 H vx EN} 
6. 写 一 个 关于 下 面 集 合 的 基于 规则 的 定义 : 
(0, 9, 18, 27, 36, 45, 54, 63, 72, 81} 


7. 什么 数学 符号 用 于 表示 运算 并 、 交 和 差 ? 
8. 计算 下 面 的 集合 表达 式 : 
a) (a, b, c U (a, c, e) b) (a, b, c) a, c, e) 
c) (a, b, c) — 1a, c, e} d) ({a, b, c) — (a, c, e) U((a, b, c) — (a, c, e}) 


9. 子 集 和 真子 集 的 区 别 是 什么 ? 
10. 给 出 一 个 有 限 集 合 的 例子 ， 要 求 它 是 另 一 个 有 限 集 的 真子 集 。 
11. 对 于 以 下 每 一 个 集合 运算 ， 画 出 它们 各 自 的 韦 因 图， 图 中 的 阴影 区 域 表 示 和 集合 表达 式 的 计算 结果 : 
a) AU(BNC) b) (A—C) n (B—C) 
c) (A4—B)U (B>A) d) (4U B)—(An B) 
12. 写 出 表示 以 下 每 个 韦 恩 图 的 阴影 区 域 所 表示 的 集合 表达 式 : 
a) 





13. 画 出 表示 表 17-1 中 每 个 恒等式 的 韦 恩 图 。 

14. 什么 是 一 个 集合 的 基数 ? 

15. Set 类 的 一 般 实现 方法 是 采用 一 个 前 面 章节 介绍 的 数据 结构 来 表示 集合 元 素 。 那 种 结构 是 什么 ? 那 
种 结构 的 什么 性 质 使 得 它 对 于 这 个 目的 有 用 ? 

16. 什么 是 特征 向 量 ? 

17. 为 了 使 用 特征 向 量 作 为 一 种 实现 策略 ， 集 合 必须 要 有 什么 限制 ? 

18. 假设 RANGE_SIZE 的 值 为 10， 画 出 集合 (1, 4, 9} 的 特征 向 量 表 示 。 

19. 以 下 的 特征 向 量 表 示 什 么 集合 : 


oojojololojolololojolololojolololojololololojololololololololo 
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通过 查询 表 1-2 所 示 的 ASCI 码 表 ， 确 定 在 <cctype> 中 与 该 集合 相对 应 的 函数 。 

20. 在 特征 向 量 图 中 , 一 个 unsigned long 类 型 为 32 位 。 假 设 你 有 一 台 机 器 ， 其 中 64 位 的 long 
类 型 数 代 替 了 原来 32 位 的 unsigned long 类 型 数 ， 那 么 本 章 给 出 的 代码 还 能 在 你 的 机 器 上 继续 
工作 吗 ? 

21. 假设 变量 x 和 y 的 类 型 都 是 unsigned short， 并 且 包 含 以 下 比特 : 


xlolilolojilololololilololilolol 
y |oJojoJojo[ojo[oj1[1]1/1]1|1]1]1] 
以 比特 序列 的 形式 给 出 以 下 表达 式 的 值 : 
a)x&y b x ly 
xy d) x^x 
e) ~x f) x & ~y 
g) ~x & ~y h) y >> 4 
Ü)x-««s j) (x > 8) & y 


22. 使 用 八进制 和 十 六 进 制 ， 将 上 题 中 的 变量 x 和 y 作为 常数 计算 它们 的 值 。 

23. 假设 变量 x Al mask 都 被 声明 为 unsigned 类型， 并且 mask 的 值 在 某 些 位 置 上 包含 一 个 单独 的 
比特 1。 你 将 用 什么 表达 式 来 实现 下 面 的 操作 : 
a. 测试 在 x 与 mask 相对 应 的 比特 ， 观 察 它 是 否 非 零 。 
b. 设置 在 x PAI mask 中 的 比特 相对 应 的 比特 
c. 清除 在 x 中 和 mask 中 的 比特 相对 应 的 比特 
d. 在 x 中 和 mask 中 的 比特 相对 应 的 比特 的 补 码 

24. 编写 一 个 表达 式 ， 构 建 一 个 unsigned 类 型 的 掩 码 ， 其 中 ,在 比特 位 置 k 处 ， 有 一 个 单独 的 比 
特 1， 比 特 是 从 0 开始 计数 ， 并 且 从 右边 结尾 处 开始 。 例 如 ， 如 果 k 为 2， 表 达 式 应 该 产生 下 面 的 
掩 码 : 


9Q0gggggggggggggggoggggg009090g0 

习题 

1. 为 了 使 我 们 更 容易 编写 使 用 Sec 类 的 程序 ，set .h 接口 提供 一 个 >> 操作 符 的 重 载 版 本 ， 从 一 个 输 
入 流 中 读 取 集合 ， 这 将 很 有 用 。 在 可 能 的 情况 下 ，>> 操作 符 应 该 和 前 面 章 节 中 描述 的 << 操作 符 保 
持 均衡 。 特 别 地 ，>> 操作 符 应 该 要 求 集合 中 元 素 都 在 花 括 号 中 ， 并 用 逗号 隅 开 。 

2. 编写 一 个 简单 的 测试 程序 ， 要 求 该 程序 使 用 前 面 习题 中 的 >> 操作 符 来 读 取 两 个 字符 串 集合 ， 然 
后 展示 在 这 些 集 合 上 调用 并 、 交 和 差 操 作 符 的 结果 。 这 个 程序 的 一 个 示例 运行 结果 可 能 如 下 图 
所 示 : 





‘sl + s2 = ("") 
isl * s2 = {""} 
sl - s2 = {} 


Rr 


3. 编写 一 个 函数 : 
Set<int> createPrimeSet (int max) 


该 函数 返回 一 个 包含 2 和 max 之 间 所 有 素数 的 集合 。 一 个 数 N 如 果 是 素数 则 当 且 仅 当 它 只 有 两 个 公 
约 数 : 1 和 数 N 本身 。 然 而 ,素数 的 检测 不 需要 你 尝试 每 一个 可 能 的 公约 数 。 你 只 需要 检测 的 数 是 
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2 入 的 平方 根 之 间 的 素数 。 当 它 检测 一 个 数 是 否 为 素数 时 ， 你 应 该 利用 这 个 事实 ， 即 所 有 潜在 的 
因数 一 定 在 你 已 经 构建 的 素数 集合 中 。 


.本章 只 简 述 了 Set 类 的 实现 方法 。 通 过 补充 私有 的 部 分 来 完成 set 类 ， 私 有 部 分 定义 了 集合 的 结 


构 和 实现 Sec 类 的 代码 以 完成 set, 其中， 将 代码 作为 一 个 映射 的 基于 树 的 版 本 之 上 的 分 层 
抽象 。 


. 正如 本 章 中 所 论述 的 ， 集 合 的 类 库 实现 使 用 了 平衡 二 又 搜 索 树 来 确保 集合 的 迭代 按 排列 的 顺序 产生 


键 。 如 果 集 合 的 近代 不 成 问题 ， 你 可 以 通过 使 用 哈 希 表 作为 基本 表示 以 获得 更 好 的 性 能 。 采 用 这 个 
策略 ， 写 出 Hashset 类 的 接口 和 实现 。 


; 编写 一 个 程序 ， 要 求实 现下 面 的 过 程 : 


© 读 取 两 个 字符 串 ， 每 一 个 代表 一 个 比特 序列 。 这 些 字 符 串 必须 只 包含 字符 0 和 1， 并 且 必 须 都 是 
16 个 字符 的 长 度 。 
。 使 用 比特 相同 的 内 在 模式 ， 将 这 些 字符 串 转 化 为 unsigned short 类 型 的 值 。 假 设 用 于 存储 转 
换 后 的 结果 的 变量 名 为 x y. 
e 将 下 面 表达 式 表示 为 一 个 16 比特 的 序列 : x & y. x | y. x ^ y. ~y、x& ~yo 
下 面 的 示例 运行 结果 展示 了 这 个 程序 的 操作 : 
300 . BiOperations 
Enter x: 0000000000101010 
Enter y: 0000000000011011 
x & y = 0000000000001010 


x | y = 0000000000111011 
x ^ y = 0000000000110001 





^y 7 1111111111100100 
x & ~y = 0000000000100000 


.在 大 部 分 的 计算 机 系统 中 ,第 3 章 介 绍 的 ANSI<cctype> 接口 是 采用 位 操作 符 实现 的 。 其 实现 策 


略 是 使 用 一 个 字 中 的 特定 比特 位 位 置 来 表示 一 个 下 标 所 对 应 的 字符 。 例 如 ， 想 象 一 下 ， 如 下 图 所 示 
的 在 一 个 字 右边 结尾 处 的 三 个 比特 位 用 来 指出 一 个 字符 是 否 是 一 个 数字 、 一 个 小 写字 母 ， 或 者 是 一 
个 大 写字 母 ? 

表示 一 个 大 写字 母 

表示 一 个 小 写字 母 

表示 一 个 数字 





如 果 你 创建 了 由 256 个 这 种 字 组 成 的 数组 (一 个 字 用 于 表示 一 个 字符 )， 那 么 你 可 以 实现 <cctype> 
中 的 函数 ， 这 样 每 个 函数 需要 选择 数组 中 的 合适 元 素 ， 应 用 某 个 位 操作 符 并 测试 结果 。 

使 用 这 种 策略 实现 «cctype» 接口 的 一 个 简化 版 本 ， 要 求 该 接口 提供 函数 isdigit, islower, 
isalpha 和 isalnum。 重 要 的 是 要 确保 函数 isalpha fllisalnum 的 实现 不 能 比 其 他 函数 有 更 
多 的 操作 符 。 


.实现 一 个 Set«char» 模板 类 ， 它 采用 字符 矢量 表示 而 不 是 通常 的 二 又 树 表 示 。 
.实现 一 个 Set«int» 模板 类 ， 若 其 中 的 元 素 值 在 0 一 255 的 范围 内 ， 要 求 使 用 特征 向 量 表示 ， 但 是 


如 果 用 户 添加 了 范围 之 外 的 元 素 ， 必 须 使 用 传统 的 表示 方法 。 
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图 





因此 我 用 逐条 链 路 将 世界 连 在 一 起 ， 从 Delos 到 Limerick 再 返回 。 
一 一 和 鲁 德 亚 德 * & | # (Rudyard Kipling), 
“gt 3 z JK” (The Song ofthe Banjo), 1894 


现实 世界 中 很 多 结构 都 是 由 一 系列 用 链 相 连接 的 值 构成 的 。 这 样 的 结构 就 是 图 (graph). 
图 的 常见 例子 包括 由 高 速 公 路 所 连接 的 城市 ， 由 超 链 接连 接 的 网 页 ， 由 各 种 预备 知识 连接 的 
大 学 课程 。 尽 管 在 数学 中 分 别 用 顶点 (vertex) 和 边 (edge) 来 表示 它们 ， 但 程序 员 一 般 将 独 
立 的 元 素 (如 城市 网 页 和 课程 等 ) 称 为 节点 (node); 而 将 像 高 速 公 路 、 超 链接 以 及 先决 条 件 
这 些 相互 的 联系 称 为 统 (arc)。 

图 是 由 一 系列 链 连 接 的 节点 构成 的 ， 它 和 第 16 章 介 绍 过 的 树 比较 相像 。 事 实 上 ， 它 们 
的 唯一 不 同 点 在 于 : 对 图 中 的 连接 结构 的 约束 要 比 树 少 。 例 如 ， 图 中 的 弧 通 常会 有 回路 。 而 
在 树 中 ， 由 于 每 一 个 节点 都 要 通过 一 个 特殊 的 线 与 它 的 根部 相连 ， 所 以 这 种 结构 是 不 允许 出 
现 的 。 因 为 树 中 的 约束 不 适合 图 ， 所 以 图 是 一 种 更 通用 的 类 型 ， 而 树 是 图 的 一 个 子 集 。 因 
此 ， 每 棵 树 都 是 一 个 图 ， 而 某 些 图 不 是 树 。 

在 本 章 ， 你 将 从 理论 和 实践 两 个 方面 学 习 图 。 学 会 将 图 作为 一 种 编程 工具 是 很 有 用 的 ， 
因为 它 在 大 量 的 环境 中 都 会 出 现 。 掌 握 这 种 理论 也 很 重要 ， 它 为 我 们 对 那些 实践 性 较 强 的 问 
题 找 出 更 有 效 的 解决 方案 提供 了 可 能 。 


18.1 图 的 结构 


理解 图 结构 最 简单 的 方法 就 是 考虑 一 个 简单 的 例子 。 假 如 你 在 一 家 小 型 航空 公司 工作 ， 
它 为 美国 10 个 主要 城市 提供 航班 ， 航 线 如 图 18-1 所 示 。 标 出 的 圆 点 代表 城市 ， 它 构成 了 图 
的 节点 。 城 市 间 的 线条 代表 航线 ， 构 成 了 图 的 弧 。 





图 18-1 小 型 的 服务 于 10 个 城市 的 航线 图 
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图 通常 用 来 表示 地 理 关 系 ， 但 你 要 牢记 图 仅仅 是 由 节点 和 连接 边 定 义 的 。 从 图 的 抽象 概 
念 来 看 ， 它 的 布局 并 不 重要 。 例 如 ， 下 图 和 图 18-1 所 表示 的 图 是 一 样 的 : 


Seattle 





Portland 


San Francisco 


Los Angeles 


Dallas Atlanta 


节点 代表 城市 的 位 置 ， 而 不 是 它 地 理 上 的 正确 位 置 ， 但 是 它们 之 间 的 关系 是 相同 的 。 

你 可 以 更 进一步 忽略 它们 之 间 的 几何 关系 。 数 学 家 使 用 一 系列 的 理论 将 图 定义 为 两 个 集 
合 的 组 合 , 即 广 和 E 这 两 个 在 数学 中 被 称 为 顶点 (vertex) MA (edge) MRA. PM, MA 
图 由 下 列 集合 构成 : 


V- { Atlanta, Boston, Chicago, Dallas, Denver, Los Angeles, 
New York, Portland, San Francisco, Seattle } 

E= { Atlanta<>Chicago, Atlanta<>Dallas, Atlanta<>New York, 
Boston<> New York, Boston<>Seattle, Chicago<>Denver, 
Dallas<> Denver, Dallas<>Los Angeles, Dallas<>San Francisco, 
Denver<>San Francisco, Portland<>San Francisco, 
Portland<>Seattle } 


图 除了 在 数学 理论 上 的 重大 意义 外 ， 用 集合 方式 来 定义 图 简化 了 它 的 实现 。 因 为 Set 
类 已 经 实现 了 很 多 必要 的 操作 。 


18.1.1 有 向 图 和 无 向 图 


由 于 图 中 的 弧 没 有 标示 方向 ， 因 此 ， 在 图 18-1 中 的 弧 线 就 表示 飞机 在 两 个 方向 上 都 是 
有 航班 的 ， 例 如 ，Atalanta 和 Chicago 之 间 有 连 线 意 味 着 也 存在 Chicago 到 Atalanta 的 航班 。 
如 果 在 一 个 图 中 所 有 节点 的 连接 都 是 双向 的 ， 则 称 该 图 为 无 向 图 (undiercted graph)。 很 多 
情况 下 ， 是 需要 用 有 向 图 ( diercted graph) 的 ， 其 中 的 每 个 弧 都 是 有 方向 的 。 例 如 ， 如 果 你 
的 航线 从 San Francisco 到 Dallas 有 直 航 航班 ， 且 返航 时 在 Denver 有 一 次 停留 ， 那 么 这 样 的 
路 线 在 有 向 图 中 看 起 来 如 下 图 所 示 : 


Denver 


San 
Francisco 


Dallas 


本 书 中 的 有 向 图 必须 是 用 带 箭头 的 弧 以 指明 其 方向 的 图 。 如 果 没 有 箭头 的 话 ， 可 以 认为 
它 是 无 向 图 ， 如 在 图 18-1 中 看 到 的 航线 图 一 样 。 

有 向 图 中 的 弧 可 以 用 记号 start — finish 标注 ,start 和 finish 是 有 向 弧 的 两 个 节点 。 因 此 ， 
上 图 中 那个 三 角 路 线 图 可 以 由 下 面 的 弧 组 成 : 

San Francisco 一 Dallas 


Dallas — Denver 
Denver — San Francisco 
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尽管 无 向 图 中 的 弧 经 常用 双 箭头 表示 ， 但 实际 上 你 不 需要 一 个 独立 的 符号 。 如 果 一 个 图 中 包 
含 无 向 弧 ， 你 可 以 用 一 对 有 向 弧 来 表示 它 。 例 如 ， 如 果 一 个 图 中 包含 双向 弧 Porti <> 
Seattle， 你 可 以 通过 Port1l 一 Seattle 和 Seattle 一 Portland 这 对 弧 来 表示 这 
个 事实 。 因 为 经 常 可 以 用 有 向 图 来 表示 无 向 图 ， 所 以 包括 本 章 介绍 的 大 多 数 图 都 支持 有 向 
图 。 如 果 你 想 定义 一 个 无 向 图 ， 需 要 为 每 一 对 有 联系 节点 在 两 个 方向 上 都 分 别 定义 一 个 有 
HES 


18.1.2 路径 和 回路 


在 图 中 ， 弧 表示 直接 的 联系 ， 这 与 航班 例子 中 不 停靠 的 航班 是 一 致 的 。 在 航线 图 中 ， 不 
770| 存在 San Francisco—New York 的 航班 ， 这 并 不 意味 着 你 不 可 以 坐 飞机 在 那些 城市 之 
间 旅 行 。 如 果 你 想 从 San Francisco 飞 往 New York， 你 可 以 使 用 如 下 任意 一 条 路 线 : 


San Francisco — Dallas — Atlanta — New York 
San Francisco — Denver — Chicago — Atlanta — New York 
San Francisco — Portland — Seattle — Boston — New York 


允许 你 从 一 个 节点 到 达 另 外 一 个 节点 的 弧 序 列 被 称 为 路 径 (path)。 如 果 该 路 径 的 起 点 和 
终点 是 相同 的 ， 例 如 以 下 路 径 


Dallas — Atlanta — Chicago — Denver — Dallas 


则 称 它 为 回路 (cycle)。 简 单 路 径 (simple path) 是 不 包含 重复 节点 的 路 径 。 同 理 ， 简 单 回路 
中 除了 起 点 和 终点 相同 之 外 ， 其 余 各 节点 也 是 互 不 相同 的 。 

在 图 中 ， 如 果 两 个 节点 之 间 是 用 一 条 弧 连 接 在 一 起 的 ， 则 称 它 们 为 相 邻 节点 
(neighbors)。 如 果 你 计算 了 某 个 节点 的 相 邻 节点 数 ， 则 称 该 数 是 这 个 节点 的 度 (degree). 
例如 ， 在 航线 图 中 ，Dallas 的 度数 为 4， 因 为 它 与 4 个 城市 直接 相连 ， 即 它 与 Atlanta、 
Denver, Los Angeles 和 San Francisco 相连 。 男 外 , Los Angeles 的 度数 为 
1， 因 为 它 仅 仅 和 Dallas 相连 。 在 有 向 图 中 ， 区 别 入 度 ( in-degree) MHE ( out-degree) 
是 很 有 用 的 。 和 人 度 是 以 该 节点 为 终点 的 弧 的 数量 ， 而 出 度 是 以 该 节点 为 初始 点 的 弧 的 
数量 。 


18.1.3 连通 性 


在 一 个 无 向 图 中 ， 如 果 每 个 节点 都 存在 与 其 他 剩余 节点 的 路 径 ， 则 称 该 图 为 连通 的 
(connected). #40, FA 18-1 所 示 的 航线 图 就 是 按照 这 种 规则 连接 的 。 然 而 ， 定 义 图 时 并 不 
需要 将 所 有 的 节点 连接 在 一 个 单一 的 单元 中 。 如 下 图 所 示 : 


a 


这 是 一 个 非 连 通 图 。 因 为 不 能 将 图 内 部 的 四 个 节点 组 成 的 链 与 其 他 的 节点 相连 。 
对 于 任意 一 个 非 连通 图 ， 你 可 以 将 它 分 解 为 一 系列 连通 的 子 图 ， 但 是 这 些 子 图 之 间 是 不 
存在 连接 关系 的 。 这 些 子 图 称 为 图 的 连通 分 支 ( connected component)。 上 图 的 连通 分 支 如 
下 图 所 示 : 
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对 于 有 向 图 来 说 ， 连 通 的 概念 就 更 为 复杂 了 。 如 果 一 个 连通 图 中 每 对 节点 都 有 连接 ， 则 
称 该 图 为 强 连 通 的 (strongly connected)。 如 果 一 个 有 向 图 在 去 除了 弧 的 方向 后 是 连通 图 ， 
则 称 之 为 弱 连 通 的 (weakly connected)。 如 下 图 所 示 : 


[| 


它 不 是 强 连通 的 ， 因 为 你 不 能 按照 图 中 弧 所 示 的 方向 从 右 下 的 节点 移动 到 左上 的 节点 。 换 句 
话说 ， 它 是 弱 连 通 的 ， 这 个 图 在 去 除了 箭头 以 后 是 一 个 连通 图 ， 因 此 它 是 弱 连 通 的 。 如 果 你 
改变 了 图 中 最 上 面 弧 的 箭头 方向 ， 那 么 所 得 到 的 图 就 是 一 个 强 连通 图 。 如 下 图 所 示 


18.2 ”表示 策略 


像 很 多 的 抽象 结构 一 样 ， 有 很 多 方法 来 实现 图 。 这 些 实现 最 主要 的 不 同 点 就 是 用 来 表达 
节点 之 间 关 系 的 策略 不 同 。 实 际 上 ， 最 常用 的 策略 有 : 

© 把 每 个 节点 的 关系 存储 在 邻接 表 中 。 

e 将 整个 图 中 所 有 的 关系 存储 在 一 个 邻接 矩阵 中 。 

e 将 每 个 节点 的 关系 存在 一 个 缴 集 合 内 。 

本 节 接 下 来 的 部 分 将 会 进一步 详细 描述 这 些 表示 策 略 。 


18.2.1 用 邻接 表 表 示 连 接 关系 


图 中 最 简单 的 表示 关系 的 方法 就 是 将 每 一 个 节点 及 与 它 有 联系 的 节点 的 数据 结构 用 一 个 
链表 示 。 这 种 结构 被 称 为 邻接 表 (adjacency list)。 例 如 ， 在 当前 熟悉 的 航线 图 例子 中 : 


Seattie 


Portiand Boston 
San Francisco I Chicago 
Los Angeles EN New York 
Dallas Atlanta 
每 个 节点 的 邻接 表 如 下 所 示 : 
Atlanta (Chicago, Dallas, New York) 


= 

Boston — (New York, Seattle) 

Chicago — (Atlanta, Denver) 

Dallas — (Atlanta, Denver, Los Angeles) 

Denver — (Chicago, Dallas, San Francisco) 
< 


Los Angeles (Dallas) 
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Los Angeles — (Dallas) 

New York — (Atlanta, Boston) 
Portland —> (San Francisco, Seattle) 
San Francisco —> (Dallas, Denver, Portland) 
Seattle — (Boston, Portland) 


18.2.2 ”用 邻接 矩阵 表示 连接 关系 


尽管 在 图 的 表示 中 ， 链 表 提 供 了 一 个 简单 的 表示 连接 的 方法 。 然 而 在 寻找 与 某 个 节点 有 
关 的 弧 序列 时 ， 这 样 的 操作 就 不 太 高 效 了 。 例 如 ， 在 使 用 邻接 表 来 表示 图 时 ， 判 断 两 个 节点 
是 否 连接 需要 的 时 间 复 杂 度 为 O (D), HP D 表示 源 节点 的 度数 。 如 果 图 中 所 有 节点 的 度数 
都 很 小 ， 搜 寻 这 个 邻接 表 的 代价 就 会 比较 小 。 然 而 ， 若 图 中 每 个 节点 都 有 较 高 的 度数 ， 那 么 
搜索 代价 就 会 相当 大 。 

考虑 到 效率 问题 ， 你 可 以 将 图 中 的 弧 存 人 一 个 被 称 为 邻接 矩阵 (adjacency matrix) 的 二 
维 数组 中 。 它 存储 了 节点 之 间 的 关系 ， 这 样 可 使 检查 节点 间 的 关系 操作 变 为 常量 时 间 。 航 线 
图 的 邻接 矩阵 如 下 图 所 示 : 


Los Angeles 


New York 





对 于 像 这 样 的 无 向 图 而 言 ， 它 的 邻接 矩阵 是 对 称 的 〈symmetric)， 说 明 这 个 矩阵 主 对 角 线 两 
侧 的 内 容 完全 一 样 ， 主 对 角 线 如 图 中 的 虚线 所 示 。 

为 了 使 用 邻接 矩阵 存储 图 ， 表 中 的 行 号 或 列 号 都 表示 图 中 的 一 个 节点 。 作 为 该 图 具体 结 
构 的 一 部 分 ， 实 现 中 需要 分 配 一 个 由 行 号 和 列 号 组 成 的 表示 图 中 节点 的 二 维 网 格 。 数 组 中 元 
素 的 值 为 布尔 值 。 如 果 matrix [start] [finish] 中 的 值 为 真 ， 则 在 图 中 存在 一 条 start 一 finish 
的 弧 。 

从 执行 时 间 来 看 ， 使 用 邻接 矩阵 方法 明显 比 使 用 邻接 表 快 。 男 外 ， 邻 接 矩 阵 需 要 的 存储 
空间 为 O(N?”)， 其 中 入 表示 图 中 节点 的 个 数 。 虽 然 在 某 些 图 中 并 非 如 此 ,但 对 于 大 部 分 图 
来 说 ， 从 空间 角度 来 看 使 用 邻接 表 的 表示 更 为 高 效 。 在 邻接 表 表 示 中 ， 每 个 节点 和 其 他 节点 
都 有 一 个 连接 列表 ， 在 最 坏 的 情况 下 ， 节 点 的 连接 数 可 能 达到 Dow, HP Da 是 图 中 各 个 
节点 中 最 大 的 度数 ， 即 从 一 个 单独 节点 所 发 出 的 最 大 弧 数 。 因 此 ， 邻 接 表 的 空间 复杂 度 为 O 
(NX Dmax)。 如 果 大 多 数 的 节点 和 其 他 节点 是 相互 连通 的 ，Dwss 的 值 就 与 W 值 相 对 比较 接近 ， 
这 也 就 意味 着 用 这 两 种 方法 表示 的 代价 是 相当 的 。 另 一 方面 ， 如 果 一 个 图 有 很 多 节点 ,但 各 
个 节点 之 间 的 联系 相对 较 少 ， 使 用 邻接 表 表 示 就 可 以 节约 大 量 的 空间 。 
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尽管 图 的 分 类 界线 还 没有 严格 的 定义 ， 但 那些 D. 的 值 与 YX 值 相 比 而 言 较 小 的 图 被 称 
为 稀疏 图 (sparse). RZ, Dmax ES N 值 接近 的 图 被 称 为 稠密 图 ( dense)。 通 常 ， 你 采用 
的 图 算法 及 表示 策略 取决 于 你 是 否 想 让 此 图 成 为 稀疏 图 或 稠密 图 。 例 如 ， 之 前 的 分 析 表 明 对 
于 稀疏 图 用 邻接 表 表 示 更 适合 ; 而 处 理 稠密 图 时 ， 采 用 邻接 矩阵 是 一 个 更 好 的 选择 。 


18.2.3 ”用 弧 集 合 表示 关系 


表示 图 关系 的 第 三 种 策略 的 动机 来 源 于 数学 公式 化 地 将 一 个 图 表示 为 一 个 节点 和 一 系列 
弧 的 集合 ”如果 你 满足 于 除了 一 个 节点 的 名 字 之 外 不 存储 别 的 有 关节 点 的 信息 ， 你 就 可 以 将 
图 定义 为 节点 与 弧 的 集合 ， 如 下 所 示 : 


struct StringBasedGraph { 
Set<string> nodes; 
Set<string> arcs; 


}; 
节点 集合 包括 图 中 的 所 有 节点 。 弧 集合 包括 一 对 以 某 种 方式 连接 的 节点 的 名 字 ， 用 这 种 方式 
表示 可 以 更 容易 地 区 分 哪个 节点 是 弧 的 开始 或 者 结束 。 

这 种 图 表示 方式 的 最 主要 优点 就 是 它 在 概念 上 的 简单 性 以 及 它 能 准确 地 反映 了 图 的 数学 
定义 。 然 而 ， 这 种 表示 也 有 两 个 重要 的 局 限 性 。 首 先 ， 找 出 特定 节点 的 邻接 节点 需要 遍历 图 
中 的 每 条 边 。 其 次 ， 最 主要 的 应 用 是 需要 将 独立 的 节点 和 弧 的 信息 与 其 他 附加 的 信息 联系 到 
一 起 。 例 如 ， 很 多 图 算法 会 对 每 一 条 弧 赋 一 个 数值 来 表示 遍历 弧 所 需要 的 代价 (cost), EAT 
能 在 实际 的 货币 成 本 中 提 及 或 未 提 及 。 例 如 ， 图 18-2 中 的 航线 图 上 的 每 个 弧 有 表示 它们 两 
个 节点 之 间距 离 的 数字 。 你 可 以 使 用 这 个 信息 来 实现 一 个 优惠 程序 ， 节 点 表示 一 个 频繁 飞行 
的 旅客 ， 而 弧 值 表示 所 航行 的 距离 。 


San 
Francisco 





Los 
Angeles Atlanta 


Dallas 


图 18-2 带 有 相关 旅行 数据 的 飞行 线路 图 


幸运 的 是 ， 解 决 上 述 问题 并 非特 别 困难 。 如 果 你 采用 支持 迭代 的 集合 类 来 表示 一 个 图 中 
的 结 点 和 弧 ， 则 对 它们 进行 迭代 会 很 容易 。 而 且 ， 通 过 采用 特定 的 数据 结构 来 表示 图 中 的 结 
点 和 弧 ， 你 还 可 以 将 额外 的 数据 添加 到 结 点 和 弧 中 。 

鉴于 C++ 是 面向 对 象 语言 ， 你 可 以 将 图 、 节 点 和 弧 均 用 对 象 来 表示 ， 并 把 每 一 层 定义 
为 一 个 新 类 。 这 种 设计 肯定 适合 于 这 种 图 的 表示 问题 ， 可 能 的 实现 方法 将 会 在 18.5 节 中 讲 
述 。 然 而 ， 下 一 节 将 把 图 用 结构 表示 而 不 是 用 类 表示 。 这 样 做 有 两 个 原因 。 首 先 ， 使 用 结构 
实现 更 简单 ， 因 为 这 样 会 重点 关注 于 高 层 的 操作 而 不 是 对 象 表示 的 细节 。 其 次 ， 底 层 的 数据 


hi 
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结构 在 实际 中 使 用 得 很 频繁 ， 由 于 存在 差异 很 大 的 图 ， 很 难 采用 一 个 通用 的 框架 来 解决 各 种 
以 图 表示 的 应 用 问题 。 因 此 ， 通 常 将 图 抽象 的 相关 部 分 加 到 一 些 其 他 数据 结构 的 实现 中 是 合 
乎 情理 的 。 如 果 这 样 做 ， 那 么 代码 与 基于 数据 结构 的 实现 更 相像 ， 而 非 本 章 后 面 将 要 讲 的 基 
于 对 象 的 实现 。 


18.3 一 种 低层 的 图 抽象 


这 部 分 将 会 概述 一 个 低级 图 包 的 设计 ， 这 里 使 用 C++ 的 结构 类 型 来 表示 图 ， 其 中 ， 整 
个 图 、 图 中 的 每 个 节点 、 连 接 各 个 节点 的 弧 是 图 中 三 种 不 同 层 次 的 图 元 素 。 作 为 最 终 设计 的 
第 一 步 ， 这 节 首 先 介 绍 了 一 个 基于 结构 类 型 的 接口 ， 它 定义 了 以 下 三 种 结构 : 

e 一 个 SimpleGraph 结构 类 型 。 使 用 这 个 名 字 是 为 了 特意 将 这 种 类 型 与 本 章 之 后 所 

要 介绍 的 Graph 类 区 分 开 。 和 图 的 数学 定义 一 样 ， 一 个 SimpleGraph 包含 两 个 集 
合 : 图 中 节点 的 集合 ; 图 中 弧 的 集合 。 并 且 ， 由 于 节点 在 这 个 公式 化 的 描述 中 是 有 
名 字 的 ， 因 此 ， 对 SimpleGraph 这 个 结构 来 说 ， 包 含 一 个 允许 用 户 将 节点 的 名 字 
和 节点 相对 应 起 来 的 图 是 很 有 用 的 。 

e 一 个 Node 结构 类 型 。 它 包含 了 节点 的 名 字 以 及 可 以 指出 图 中 该 节点 与 其 他 节点 的 

连接 关系 的 集合 。 

e 一 个 Arc 结构 类 型 。 它 可 以 确定 弧 的 结束 点 ， 以 及 一 个 表示 该 弧 所 需 代 价 的 数值 。 

这 种 数据 类 型 的 非 正式 描述 已 经 为 你 提供 了 几乎 足够 的 信息 以 编写 出 图 的 必要 定义 ， 
但 是 还 存在 一 个 你 在 设计 过 程 中 必须 考虑 的 问题 。simpleGraph 结构 概念 上 所 “包含 ” 
的 Node 值 不 仅仅 是 它 的 节点 集合 的 一 部 分 ， 也 是 弧 集 合 中 元 素 的 一 个 构件 。 同 理 ， 因 为 
SimpleGraph All Node 这 两 个 结构 都 可 以 确定 一 条 弧 ，Arc 值 会 出 现在 两 个 地 方 。 在 任何 
情况 下 ， 这 个 抽象 结构 中 涉及 同一 个 实体 时 ， 那 些 结构 的 不 同 部 分 出 现 的 节点 和 弧 必 须 完 
全 相同 。 例 如 ， Atlanta 所 对 应 的 Node 必须 和 它 在 项 层 的 节点 集 或 者 内 部 弧 中 出 现 的 
Node 表示 的 是 同一 实体 。 这 些 节点 不 是 对 某 个 节点 的 简单 复制 ， 因 为 如 果 是 那样 的 话 ， 修 
改 一 个 节点 值 就 不 会 在 其 复制 的 另外 一 个 节点 中 反映 出 来 。 | 

这 个 观察 的 重要 含义 在 于 : 表示 图 的 集合 和 结构 不 能 直接 包含 Node 和 Arc 的 值 。 共 
享 共同 结构 的 需求 就 意味 着 所 有 对 Node 和 Arc 的 内 部 引用 必须 指明 具体 的 Node fll Arc 
值 。 因 此 , 在 SimpleGraph 结构 中 的 集合 ， 必 须 使 用 Node* 和 Arc* 作为 元 素 类 型 ， 而 不 
能 用 Node 和 Arc 作为 元 素 类 型 。Node 结构 体 中 弧 集 合 和 指向 节点 的 指针 也 是 如 此 。 图 18-3 表 
示 了 一 个 低级 的 图 形 接口 ， 称 为 graphtypes.h， 以 和 18.5 节 中 更 高 级 的 graph.h 接口 进 
行 区 分 。 

图 18-3 也 说 明了 C++ 的 一 个 需要 进一步 解释 的 新 特征 。 定 义 的 Node 和 Arc 这 两 个 结 
构 类 型 是 互相 引用 的 。Node 结构 体 中 包含 指向 Arc 的 指针 ， 而 Arc 结构 体 中 也 包含 指向 
Node 的 指针 。 这 种 类 型 定义 上 的 相互 递归 使 得 我 们 不 能 像 C++ 要 求 的 那样 用 已 经 定义 的 数 
据 类 型 来 声明 这 两 者 中 的 任何 一 个 类 型 。 

C++ 允许 你 声明 一 个 类 或 结构 但 无 具体 内 容 作 为 标识 符 ， 以 此 解决 这 个 问题 。 你 要 用 一 
个 分 号 代替 这 个 类 或 者 结构 体 的 内 容 。 下 面 用 几乎 同样 的 方法 编写 一 个 递归 函数 。 


struct Node; 
struct Arc; 


以 上 两 行 代码 告诉 编译 器 Node 和 Arc 是 结构 体 的 名 称 。 这 样 就 可 以 在 它们 的 定义 之 前 声 


图 521 


明 指 向 它们 的 指针 。 这 样 的 定义 称 为 前 向 引用 (forward reference), 


/* 
* File: graphtypes.h 
* 


* This file defines low-level data structures that represent graphs. 


*/ 


#ifndef graphtypes h 
fidefine  graphtypes h 


#include <string> 
#include "map.h" 
#include "seth" 


struct Node; /* Forward references to these two types so */ 
struct Arc; /* that the C++ compiler can recognize them. */ 


/* 


This type represents a graph and consists of a set of nodes, a set of 
arcs, and a map that creates an association between names and nodes. 


struct SimpleGraph { 
Set«Node *» nodes; 
Set«Arc *» arcs; 
Map<std: : string, Node 


This type represents an individual node and consists of the 
name of the node and the set of arcs from this node. 


struct Node { 
std::string name; 
Set<Arc *> arcs; 


}; 
/* 


This type represents an individual arc and consists of pointers 
to the endpoints, along with the cost of traversing the arc. 


struct Arc ( 
Node *start; 
Node *finish; 
double cost; 
}; 


#endif 





图 18-3 ”基于 结构 类 型 的 图 形 抽象 


用 集合 定义 图 有 很 多 优点 。 尤 其 是 这 种 策略 意味 着 这 种 数据 结构 与 用 集合 定义 图 的 数学 
公式 化 表示 是 相似 的 。 分 层 的 方法 在 简化 实现 上 也 有 很 大 优点 。 例 如 ， 用 集合 定义 图 不 需要 
对 图 定义 一 个 独立 的 迭代 机 制 。 因 此 ， 如 果 你 想 在 图 g 中 遍历 其 节点 ， 你 需要 编写 以 下 语句 : 


for (Node *node : g.nodes) { 


处 理 单个 节点 的 代码 
} 


除了 简化 迭代 过 程 以 外 ， 用 和 集合 定义 图 可 以 实现 并 和 交 这 样 的 高 级 操作 。 计 算 机 理论 科学 家 
就 会 使 用 这 些 操作 来 构成 图 的 算法 。 这 些 操作 对 用 户 也 是 可 用 的 ， 使 得 算法 编写 也 更 容易 。 
graphtypes.h 接口 与 本 书 之 前 的 接口 不 同 ， 它 介绍 了 三 种 结构 类 型 而 不 是 类 和 方 
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法 。 因 此 ， 该 接口 不 需要 实现 。 所 以 graphtypes.cpp 文件 就 没有 存在 的 必要 性 。 由 于 这 个 
接口 没有 给 用 户 提 供 适 合 于 图 、 节 点 和 弧 操 作 的 方法 ， 因 此 就 迫使 用 户 定 义 自己 所 需 的 数据 结 
构 。 例 如 ， 图 184 中 的 代码 使 用 了 几 个 辅助 函数 以 创建 本 章 前 面 所 提 到 的 航线 图 ， 然 后 调用 








Dallas, New York 





|Chicago -> Atlanta, Denver | 
|Dallas -> Atlanta, Denver, Los Angeles, San Francisco i 
| Denver -> Chicago, Dallas, San Francisco k 
| Los Angeles -> Dallas | 
|New York -> Atlanta, Boston 

|Portland -> San Francisco, Seattle 

| San Francisco ~> Dallas, Denver, Portland 
| Seattle -> Boston, Portland 


File: AirlineGraph.cpp 


This program initializes the graph for the airline example and then 
prints the adjacency lists for each of the cities. 


#include <iostream> 
#include <string> 
#include "graphtypes.h" 
#include "set.h" 

using namespace std; 


/* Function prototypes */ 


void printAdjacencyLists (SimpleGraph & g); 

void initAirlineGraph (SimpleGraph & airline); 

void addFlight (SimpleGraph & airline, string cl, string c2, int miles); 
void addNode(SimpleGraph & g, string name); 

void addArc(SimpleGraph & g, Node *nl, Node *n2, double cost); 


/* Main program */ 


int main() ( 
SimpleGraph airline; 
initAirlineGraph (airline); 
printAdjacencyLists (airline); 
return 0; 


Function: printAdjacencyLists 
Usage: printAdjacencyLists (g); 


Prints the adjacency list for each city in the graph. 
*7 


void printAdjacencyLists (SimpleGraph & g) { 
for (Node *node : g.nodes) ( 
cout «« node-»name «« " -» "; 
bool first - true; 
for (Arc *arc : node->arcs) { 
if (!first) cout «« ", "; 
cout << arc-»finish-»name; 
first - false; 
) 


cout «« endl; 


) 
/* 
* Function: initAirlineGraph 
* Usage: initAirlineGraph (airline) ; 





图 18-4 创建 航线 图 的 程序 
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* Initializes the airline graph to hold the flight data from Figure 18-2. 
* In a real application, the program would almost certainly read this 
* information from a data file. 


E 


void initAirlineGraph(SimpleGraph & airline) ( 


addNode (airline, 
addNode (airline, 
addNode (airline, 
addNode (airline, 
addNode (airline, 
addNode (airline, 
addNode (airline, 
addNode (airline, 
addNode (airline, 
addNode (airline, 


"Atlanta"); 
"Boston"); 
"Chicago"); 
"Dallas"); 
"Denver"); 

"Los Angeles"); 
"New York"); 
"Portland"); 

"San Francisco"); 
"Seattle"); 


"Atlanta", "Chicago", 599); 
"Atlanta", "Dallas", 725); 
"Atlanta", "New York", 756); 
"New York", 191); 


addFlight (airline, 
addFlight (airline, 
addFlight (airline, 
addFlight (airline, "Boston", 
addFlight(airline, "Boston", "Seattle", 2489); 
addFlight(airline, "Chicago", "Denver", 907); 
addFlight(airline, "Dallas", "Denver", 650); 
addFlight(airline, "Dallas", "Los Angeles", 1240); 
addFlight(airline, "Dallas", "San Francisco", 1468); 
addFlight(airline, "Denver", "San Francisco", 954); 
addFlight(airline, "Portland", "San Francisco", 550); 
addFlight(airline, "Portland", "Seattle", 130); 


* Function: addFlight 
Usage: addFlight (airline, cl, c2, miles); 


Adds an arc in each direction between the cities cl and c2. 
*/ 


void addFlight (SimpleGraph & airline, string cl, string c2, int miles) { 
Node *nl = airline.nodeMap[cl]; 
Node *n2 - airline.nodeMap[c2]; 
addArc (airline, nl, n2, miles); 
addArc (airline, n2, nl, miles); 


* Function: addNode 


Adds a new node with the specified name to the graph. 
£/ 


void addNode(SimpleGraph & g, string name) ( 
Node *node - new Node; 
node-»name - name; 
g.nodes. add (node) ; 
g.nodeMap[name] - node; 


Function: addArc 
Usage: addArc(g, nl, n2, cost); 


Adds a directed arc to the graph connecting nl to n2. 


MS 


void addArc(SimpleGraph & g, Node *nl, Node *n2, double cost) { 
Arc *arc - new Arc; 
arc-»start = nl; 
arc-»finish = n2; 
arc-»cost - cost; 
g.arcs.add(arc); 
nl-»arcs.add(arc); 





图 18-4 (E) 
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如 果 你 仔细 思考 示例 程序 的 运行 结果 ， 会 发 现 所 有 的 城市 名 称 是 按 字母 顺序 出 现 的 ， 这 
可 能 会 让 你 比较 惊讶 。 这 些 图 元 素 集合 在 建立 的 时 候 ， 最 起 码 在 数学 形式 上 是 无 序 的 集 
合 。 算 法 中 的 for 循环 让 Node 和 Arc 指针 在 内 存 中 出 现 的 顺序 和 它们 在 结构 体 中 出 现 的 
顺序 是 相同 的 。 既 然 内 存 和 城市 名 称 是 没有 联系 的 ， 那 么 输出 结果 按照 字母 序列 排序 就 有 点 
奇怪 了 。 

导致 这 个 看 似 奇怪 的 行为 的 原因 就 是 : C++ 运行 时 间 系 统 按照 指令 出 现 的 先后 顺序 分 配 
堆 内 存 。 表 18-4 的 初始 化 操作 是 按照 字母 表 顺 序 建立 城市 以 及 它们 之 间 联 系 的 。 这 也 就 意 
味 着 与 第 一 个 节点 的 城市 相 比 ， 第 二 个 节点 的 城市 在 人 了 更 高 的 内 存 地 址 中 。 因 此 ， 输 出 结 
果 如 此 有 序 仅仅 是 个 巧合 ， 在 不 同 的 平台 上 也 不 一 定 总 是 如 此 。 你 会 在 第 20 章 看 到 可 以 扩展 
Set 类 的 定义 ， 因 此 它 的 用 户 就 可 以 定义 元 素 出 现 的 次 序 ， 例 如 这 个 例子 中 的 Graph 类 。 


18.4 图 的 遍历 

正如 之 前 的 例子 ， 遍 历 图 中 的 节点 是 很 容易 的 ， 只 要 依照 抽象 集合 规定 的 顺序 来 按 序 处 
理 节 点 即 可 。 然 而 ， 许 多 图 算法 要 求 你 在 处 理 节点 时 把 它们 之 间 的 联系 考虑 进去 。 这 种 算法 
通常 开始 于 一 些 节 点 ， 然 后 沿 弧 移动 ， 从 一 个 节点 前 进 到 另 一 个 节点 ， 并 在 每 个 节点 上 执行 
某 种 操作 。 这 个 操作 的 确切 性 取决 于 算法 ， 但 执行 该 操作 的 过 程 (无 论 何 种 操作 ) 被 称 为 访 
i) (visiting) 节点 。 沿 着 弧 访问 图 中 每 一 个 节点 的 过 程 被 称 为 图 的 遍历 (traversing)。 

在 第 16 章 你 已 经 学 过 几 种 树 的 遍历 方法 ， 最 主要 的 是 先 序 遍历 、 中 序 遍 历 和 后 序 遍历 。 
像 树 一 样 ， 图 也 提供 了 不 止 一 种 遍历 方法 。 图 有 两 种 基本 的 遍历 算法 ， 即 深度 优先 ( depth- 
first) 搜索 和 广度 优先 (breadth-first) 搜索 ， 它 们 会 在 接 下 来 的 两 节 中 介绍 。 

为 了 使 算法 机 制 更 易于 理解 ， 实 现 深 度 优先 和 广度 优先 搜索 时 ,假设 用 户 已 经 提供 了 一 
个 可 对 图 中 的 节点 进行 操作 的 visit 函数 。 遍 历 的 目标 就 是 对 每 一 个 节点 按照 关系 决定 的 
顺序 调用 有 且 仅 有 一 次 的 visit 函数 。 因 为 图 的 遍历 经 常 有 不 同 的 路 径 返 回 到 相同 的 节点 ， 
为 了 确保 遍历 算法 没有 多 次 访问 相同 的 节点 就 需要 额外 的 记忆 。 以 下 两 节 的 遍历 算法 实现 定 
义 了 一 个 叫做 visited 的 节点 集合 ， 它 用 来 标记 那些 已 经 被 处 理 过 的 节点 。 如 果 遍 历 算法 
遇 到 一 个 已 经 在 visited 节点 集合 中 的 节点 ， 那 么 这 个 节点 一 定 在 之 前 被 访问 过 了 。 


18.4.1 深度 优先 搜索 


深度 优先 搜索 遍历 类 似 于 树 的 先 序 遍 历 ， 并 且 有 相同 的 递归 结构 。 唯 一 复杂 的 是 图 中 可 
以 包含 回路 。 因 此 ， 标 记 已 被 访问 过 的 节点 是 很 必要 的 。 实 现 深度 优先 遍历 的 代码 开始 于 一 
个 特定 的 节点 ， 如 图 18-5 所 示 。 


* 


* Function: depthFirstSearch 
* Usage: depthFirstSearch (node); 
* 


* Initiates a depth-first search beginning at the specified node 
ay 


void depthFirstSearch(Node *node) ( 
Set«Node *» visited; 
visitUsingDFS (node, visited); 

) 





图 18-5 ”执行 深度 优先 搜索 的 代码 
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Function: visitUsingDFS 
Usage: visitUsingDFS (node, visited); 


* Executes a depth-first search beginning at the specified node that 
avoids revisiting any nodes in the visited set. 


void visitUsingDFS (Node *node, Set«Node *» & visited) ( 
if (visited.contains (node)) return; 
visit (node); 
visited. add (node); 
for (Arc *arc : node-»arcs) ( 


visitUsingDFS(arc-»finish, visited); 
) 


) 





图 18-5 (£&) 


在 这 个 实现 中 ，depthFirstSearch 是 一 个 封装 的 函数 ， 它 的 唯一 功能 是 产生 那些 已 
Zt Mk hb PEt hay visited#A. P visitusingprs 访问 当前 节点 ， 然 后 对 每 一 
个 最 接近 当前 节点 的 节点 直接 递归 调用 函数 自己 。 

在 一 个 简单 的 例子 中 ， 通 过 追踪 它 的 操作 是 很 容易 理解 深度 优先 算法 的 ， 例 如 本 章 开始 
介绍 的 航线 图 : 


Portiand( ) ( )Boston 





Los Angeles( ) ( )New York 
Dallas Atlanta 


如 上 图 所 示 ， 画 成 空心 圆 的 节点 表示 它 还 没 被 访问 过 。 按 照 算法 的 执行 步骤 ,这 些 圆 被 逐渐 
标记 ， 其 标记 的 数字 代表 节点 被 处 理 的 顺序 。 
假设 你 通过 调用 以 下 函数 开始 对 图 进行 深度 优先 搜索 : 


depthFirstSearch (airline.nodeMap["San Francisco"]); 


depthFirstSearch 函数 的 调用 首先 创建 了 一 个 空 的 visited 节点 集 ， 然 后 将 控制 转向 
对 visitUsingDFS 函数 的 递归 调用 。 第 一 次 调用 访问 了 San Francisco 节点 ,该 节点 
被 标记 如 下 图 所 示 : 


Seattle 





Dalias Atlanta 


EP ARIS TELL FE AA ns SA PT visitUsingDFS 进行 递归 调用 : 


for (Arc *arc : node->arcs) { 
visitUsingDFS (arc->finish, visited) ; 
} 
函数 调用 的 顺序 取决 于 for 循环 语句 通过 弧 的 顺序 。 假 设 for 语句 按照 字母 表 顺 序 处 理 节 
点 ， 第 一 次 循环 对 Dallas 节点 调用 visitUsingDES， 从 而 得 到 如 下 的 图 状态 : 
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Seattle 
Portland ( ) C) ( )Boston 


Denver Chicago 






Los Angeles ) C) ( )New York 
Dallas Atlanta 


考虑 到 代码 的 实现 方式 ， 程 序 必须 在 考虑 了 所 有 以 San Francisco 节点 出 发 的 其 他 
可 能 路 径 后 ， 才 能 完成 全 部 涉及 Dallas 节点 的 函数 调用 。 下 一 个 被 访问 的 节点 是 首先 出 
现在 字母 表 中 从 San francisco 可 达 的 城市 ， 它 就 是 Atlanta， 如 下 图 所 示 : 


Seattle 
Portland ( ) ( )Boston 


Los Angeles( ) ( )New York 
Dallas Atlanta 


深度 优先 搜索 算法 的 最 终结 果 是 在 回溯 之 前 在 图 中 探索 一 条 尽 可 能 长 的 路 径 ， 来 完成 高 
层次 的 路 径 探索 。 从 Atlanta 节点 ， 程 序 通过 选择 首先 出 现在 字母 表 中 的 相 邻 节点 沿 着 路 
径 持续 下 去 。 因 此 按照 深度 优先 搜索 算法 ， 接 下 来 应 为 chicago 和 Denver 节点 ,得 到 的 
图 具有 以 下 状态 : 


Seattle 
Portland C) C ( )Boston 





Los Angeles ( ) ( )New York 
Dallas Atlanta 
然而 ， 在 Denver 节点 处 不 可 能 再 向 前 了 ， 每 一 个 与 Denver 相 邻 的 节点 都 已 被 访问 
过 ， 因 此 此 次 函数 调用 立即 返回 。 递 归 过 程 返回 到 Chicago 节点 ， 仍 然 发 现 没 有 相 邻 节点 
在 未 被 探索 的 范围 内 。 递 归 回 溯 返 回 到 Atlanta 节点 ,现在 可 以 找到 并 且 探 索 New York 
节点 。 如 此 下 去 ， 深 度 优先 算法 探索 到 了 尽 可 能 长 的 一 条 路 径 ， 如 下 图 所 示 : 
Portland @ oa [J Boston 






Denver Chicago 


Los Angeles( ) EÐ New York 
Dallas Atlanta 


至 此 ， 算 法 过 程 将 倒退 到 Dallas 节点 ， 并 从 该 节点 找到 Los Angeles 节点 ， 如 下 图 所 示 : 


Seattle 
Portland @ [J Boston 


Denver Chicago 


E) New York 


Dallas Atlanta 


图 327 


如 果 你 考虑 到 深度 优先 算法 和 其 他 已 知 算法 之 间 的 关系 ， 就 会 意识 到 它 的 操作 和 第 9 章 
讲 的 迷宫 问题 的 算法 特别 类 似 。 在 那个 算法 中 ,为 了 避免 在 迷宫 中 永远 地 绕 着 一 个 圈 转 ， 标 
记 正 方形 是 很 必要 的 。 在 迷宫 中 的 标记 类 似 于 深度 优先 搜索 算法 中 visited 集合 中 的 节点 。 


18.4.2 ”广度 优先 搜索 


即使 深度 优先 搜索 有 许多 重要 的 应 用 ， 但 这 种 方法 的 缺点 是 它 对 某 些 应 用 是 不 适合 的 。 
深度 优先 算法 最 大 的 问题 是 在 它 回 湖 和 寻找 到 其 他 相 邻 节点 之 前 ， 探 索 了 从 一 个 相 邻 节点 开 
始 的 整个 路 径 。 如 果 你 在 一 个 大 图 中 设法 寻找 两 个 节点 之 间 的 最 短路 径 ， 采 用 深度 优先 算法 
会 带 你 到 图 中 最 远 的 地 方 ， 即 使 你 的 目的 地 沿 着 另 一 条 路 线 只 有 一 步 之 遥 。 

广度 优先 搜索 算法 以 确定 的 顺序 来 访问 图 中 的 每 个 节点 ， 从 而 解决 了 深度 优先 搜索 的 问 
题 ， 它 通过 度量 一 个 节点 距离 起 始 节点 的 远近 来 决定 是 否 访问 该 节点 ， 以 沿 着 可 能 的 最 短路 
径 弧 的 数目 作为 度量 标准 。 当 你 通过 弧 的 数目 测量 距离 时 ， 每 一 条 弧 构成 一 个 跳跃 ( hop)。 
因此 ， 广 度 优先 搜索 的 本 质 是 : 你 首先 访问 起 始 节 点 ,然后 以 跳跃 方式 离开 刚 访问 过 的 节 
点 ， 接 着 再 进行 第 二 次 跳跃 ， 以 此 类 推 。 

为 了 对 这 个 算法 有 一 个 更 加 准确 的 认识 ,假设 你 想 在 航线 图 上 再 次 从 San Francisco 
节点 开始 采用 广度 优先 遍历 。 算 法 首先 仅 简 单 地 访问 起 始 节 点 ， 如 下 图 所 示 : 


Seattle 
Portland ( ) CO) ( )Boston 





Los Angeles New York 
9 
Dallas Atlanta 


下 一 步 以 每 次 一 跳 的 方式 遍历 节点 ， 得 到 以 下 图 状态 : 


Seattle 


Denver Chicago 





Dallas Atlanta 


到 此 ， 算 法 开始 探索 有 两 个 跳跃 的 节点 : 


Seattle 
7 ( )Boston 





Dallas Atlanta 


最 后 一 步 ， 算 法 通过 访问 从 开始 数 三 个 跳跃 的 节点 来 完成 对 图 的 探索 ， 如 下 图 所 示 : 


Seattle 
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实现 广度 优先 算法 最 简单 的 方法 是 使 用 未 处 理 节点 的 队列 ， 程 序 的 每 一 步 将 与 当前 节点 
相 邻 的 节点 入 队 。 因 为 队列 是 按 顺序 处 理 的 ， 所 有 从 开始 节点 只 有 一 个 跳跃 的 节点 将 比 具 有 
两 个 跳跃 的 节点 较 早 的 出 现在 队列 中 ， 如 此 等 等 。 在 图 18-6 中 展示 了 这 个 方法 的 实现 。 


breadthFirstSearch 
adthFirstSearch (node); 


breadth-first search beginning at the specified node 


void breadthFirstSearch(Node *node) ( 
Set«Node *» visited; 
Queue<Node *> queue; 
queue . enqueue (node) ; 
while (!queue.isEmpty()) { 
node = queue.dequeue(); 
if (!visited.contains(node)) ( 
visit (node); 
visited.add (node); 
for (Arc *arc : node->arcs) ( 
queue. enqueue (arc-»finish); 





图 18-6 执行 广度 优先 搜索 的 代码 


18.5 ”定义 图 类 

图 18-3 所 示 的 graphtypes.h 接口 还 有 许多 待 完善 之 处 。 尤 其 是 现 有 的 接口 使 用 了 
底层 的 数据 结构 来 表示 图 ， 因 此 就 不 能 使 用 C++ 的 面向 对 象 特性 。 而 且 ， 使 用 C 风格 的 结 
构 类 型 意味 着 不 存在 和 图 相 绑 定 的 类 的 方法 ， 这 就 迫使 用 户 开发 自己 的 工具 。 以 下 两 节 将 会 
阐述 两 种 更 高 级 的 策略 来 替代 低级 的 图 表示 。 


18.5.1 用 类 表示 图 、 节 点 和 弧 


如 果 设 计 gzaph.h 接口 的 最 主要 目的 是 最 大 化 地 利用 面向 对 象 的 优势 的 话 ， 那 么 ， 显 
然 应 采用 类 来 代替 原 有 的 表示 图 的 每 一 个 低级 的 结构 。 采 用 这 种 策略 ， 接 口 就 会 输出 一 个 
Graph 类 ， 它 代替 了 原 有 的 SimpleGraph 结构 ， 以 及 与 Node fll Arc 结构 类 型 相 匹 配 的 
类 。 那 些 类 的 私有 部 分 就 可 以 采用 上 述 原 有 的 结构 类 型 。 然 而 ， 用 户 要 访问 这 些 域 的 话 就 需 
要 调用 类 中 的 方法 而 不 能 直接 访问 或 引用 。 

尽管 这 种 设计 可 行 ， 但 它 在 实际 应 用 中 比较 麻烦 。 为 了 了 解 其 原因 ， 注 意 到 图 的 使 用 
方式 与 我 们 所 熟悉 的 容器 类 是 不 同 的 ， 这 一 点 很 重要 ， 例 如 数组 、 栈 、 队 列 和 集合 。 这 些 
更 方便 的 容器 类 包含 了 某 种 用 户 定 义 的 类 型 值 ， 例 如 ， 在 本 书 中 ， 你 会 看 到 程序 中 声明 的 
Stack<double> 和 Set<string> 类 型 的 对 象 。 尖 括号 里 面 的 模板 参数 类 型 是 一 个 值 类 
型 。 然 而 ， 值 类 型 对 类 本 身 的 实现 不 会 产生 很 大 影响 。 

而 图 的 情况 就 不 同 。 图 的 元 素 是 节点 和 弧 ， 这 些 节 点 和 弧 结构 是 图 不 可 或 缺 的 部 分 ， 它 
们 包含 了 维护 整个 数据 结构 所 需 的 信息 。 例 如 ， 节 点 需要 保存 它 和 其 他 节点 相连 的 弧 集 ， 
弧 和 需要 记录 它们 的 端点 。 同 时 ， 用 户 可 能 基于 应 用 希望 给 每 个 节点 或 者 每 条 弧 增加 附加 的 
数据 信息 。 因 此 ， 节 点 和 弧 是 混合 的 结构 体 ， 它 们 保存 了 用 户 以 及 实现 所 需要 的 数据 。 

大 多 数 面向 对 象 语言 在 这 种 情况 下 最 常 使 用 的 策略 就 是 子 类 。 在 这 种 模型 中 ， 图 被 定义 
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为 节点 类 和 弧 类 的 父 类 (或 称 基 类 )， 它 包含 了 表示 一 个 图 结构 所 需 的 信息 。 用 户 通 过 对 图 
类 添加 数据 域 和 方法 将 其 扩展 为 子 类 。 这 种 方法 对 C++ 并 不 适用 ， 其 原因 在 第 19 章 将 进行 
更 深入 的 探索 。 最 主要 的 问题 是 动态 内 存 分 配 和 继承 在 C++ 中 不 能 一 起 使 用 ， 这 一 点 与 其 
他 语言 不 同 。 因 此 ， 有 必要 选择 另 一 种 不 同 的 策略 。 


18.5.2 ”用 参数 化 的 类 实现 图 


幸运 的 是 ， 使 用 C++ 模板 可 以 设计 一 个 Graph 类 ， 这 样 既 可 以 使 用 面向 对 象 设 计 的 
优点 ， 又 能 保留 底层 数据 结构 的 简单 性 。 这 种 设计 的 基本 理念 就 是 : 产生 一 个 参数 化 的 
Graph 类 ， 用 户 可 以 选择 图 中 节点 和 弧 的 类 型 。 然 而 ，Graph 的 模板 参数 类 型 不 能 任意 选 
择 ， 它 必须 是 能 提供 对 图 进行 基本 操作 的 类 型 ， 而 底层 的 数据 结构 刚好 满足 这 一 需要 。 因 
此 ， 用 户 选 择 表示 节点 的 类 型 必须 包含 : 

e 一 个 name 的 字符 串 ， 用 它 来 指明 节点 名 。 

e 一 个 arcs 域 ， 用 它 来 指明 开始 于 该 节点 的 弧 的 集合 。 

选择 表示 弧 的 类 型 必须 包含 : 

e ZH start 和 finish 的 域 ， 用 来 表示 弧 开始 和 结束 节点 。 
除了 所 需要 的 域 ， 用 来 表示 节点 和 弧 的 类 型 还 应 该 包含 用 户 应 用 所 需要 的 附加 信息 。 

基于 用 户 定义 的 Node 和 Arc 域 类 型 在 图 中 必须 保持 一 致 ， 因 为 所 有 指向 节点 和 弧 的 
指针 都 需要 使 用 用 户 自 定义 的 类 型 。 因 此 ， 每 个 节点 所 包含 的 弧 集 合 的 元 素 必 须 是 指向 用 户 
定义 的 Arc 类 型 的 指针 类 型 。 同 样 ， 在 Arc 结构 中 的 两 个 节点 指针 也 必须 声明 为 用 户 定 义 
的 Node 类 型 。 

Graph 类 必须 具有 对 Node 和 Arc 类 型 特定 部 分 的 访问 权限 。 一 个 提供 访问 权限 的 策 
略 就 是 使 那些 域 成 为 公有 部 分 ， 就 像 在 任何 数据 结构 中 的 那样 。 一 个 支持 封装 的 更 好 方法 
就 是 将 它们 在 类 的 私有 部 分 中 声明 ， 但 是 可 以 通过 使 用 友 元 〈friend) 声明 使 Graph 类 访问 
它们 。 

用 一 个 简单 的 例子 来 说 明 那 些 规 则 是 很 有 效 的 。 图 18-7 的 代码 定义 了 两 个 类 ，city 类 
和 Flight 类 ， 二 者 都 没有 公有 变量 。 然 而 ， 这 两 个 类 都 包含 了 所 需要 的 私有 部 分 ， 并且 
将 Graph<City,Flight> 定义 为 友 元 类 。 


class City; /* Forward references to these two types so */ 
class Flight; /* that the C++ compiler can recognize them. */ 


* 


* This class defines the node type for the airport graph. 
is 


class City { 


public: 
string getName() { 
return name; 


} 


private: 

string name; 

Set<Flight *> arcs; 

string airportCode; 

friend class Graph<City,Flight>; 
}; 





图 18-7 再 次 定义 的 航线 图 所 使 用 的 类 
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/* 
* Class: Flight 


* This class defines the arc type for the airport graph 
*/ 
class Flight ( 


public: 
City *getStart() { 
return start; 


) 


City *getFinish() { 
return finish; 


) 


int getDistance() { 
return distance; 


) 


void setDistance(int miles) { 
distance - miles; 


) 


private: 

City *start; 

City *finish; 

int distance; 

friend class Graph«City,Flight»; 
}; 





图 18-7 ( 续 ) 
鉴于 City 和 Flight 类 的 定义 ， 航线 图 自身 就 变 成 了 一 个 用 适当 的 参数 节点 和 弧 类 型 
由 Graph 类 模板 所 生成 的 一 个 模板 类 的 一 个 实例 ， 如 下 所 示 : 


Graph«City,Flight» airlineGraph; 


K 18-1 以 表格 形式 列 出 了 graph.h 接口 中 的 方法 。 图 18-8 所 示 为 该 接口 中 的 实际 内 
容 。 正 如 你 从 表 18-1 或 图 18-8 所 看 到 的 ，graph.h 的 接口 通常 对 每 个 方法 都 提供 了 多 个 
重 载 函 数 版 本 ， 从 而 确保 类 中 的 方法 能 方便 地 供用 户 使 用 。 


表 18-1 graph.h 接口 中 的 内 容 


构造 函数 

Graph<nodetype,arctype> () | 创建 一 个 没有 节点 和 弧 的 空 图 

方法 

size() 返回 图 中 的 节点 数 

isEmpty () 如 果 图 中 没有 节点 ， 则 返回 true 

clear() 将 图 中 所 有 的 节点 和 弧 删 除 

addNode (name) 给 图 中 增加 一 个 节点 。 第 一 种 形式 创建 一 个 名 为 参数 name 的 新 节点 并 加 入 到 
addNode (node) 图 中 ; 第 二 种 形式 将 用 户 创建 的 节点 node 加 入 到 图 中 

ir 从 图 中 删除 一 个 节点 以 及 所 有 和 它 相连 的 弧 


removeNode (node) 


getNode (name) 返回 图 中 参数 名 的 节点 ， 如 果 该 节点 不 存在 ， 返回 空 值 


addArc (si, $2) 
addArc (m, m) 
addArc (arc) 


在 图 中 增加 一 条 包含 两 个 参数 节点 的 弧 。 前 两 种 形式 是 增加 一 个 包含 特定 节点 
的 弧 ; 第 三 种 形式 是 用 户 增加 的 节点 


removeArc (si, $2) 
removeArc (Mm, M2) 
removeArc (arc) 


isConnected (Sj, 52) 
isConnected (nm, n;) 


getNodeSet () 
getArcSet () 


getArcSet (name) 
getArcSet (node) 


getNeighbors (name) 
getNeighbors (node) 
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删除 连接 特定 节点 的 各 个 弧 


如 果 两 个 节点 间 存 在 弧 ， 则 返回 true 


返回 图 中 所 有 节点 的 集合 
返回 图 中 所 有 弧 的 集合 


返回 特定 节点 的 弧 集 合 
返回 当前 节点 的 所 有 相 邻 节点 的 集合 ， 在 某 种 意义 上 存在 一 个 特定 节点 到 它 相 


邻 节点 间 的 一 条 弧 


/* 

* File: graph.h 

* 

* This file is the interface for a flexible graph package that exports 
* a parameterized Graph class. 


£j 


#ifndef graph h 
#define graph h 


#include <string> 
#include "map.h" 
#include "set.h" 


Class: Graph<NodeType, ArcType> 


This class represents a graph with the specified node and arc types 

The NodeType and ArcType parameters indicate the record or object types 
used for nodes and arcs, respectively These types can contain any 
fields or methods required by the client, but must contain the following 
fields required by the Graph package itself: 


NodeType definition must include: 
A string field called name 
A Set<ArcType *> field called arcs 


ArcType definition must include: 
A NodeType * field called start 
A NodeType * field called finish 


* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 


template «typename NodeType,typename ArcType» 
class Graph { 


public: 
/* 


* Constructor: Graph 
* Usage: Graph<NodeType,ArcType> g; 


* 


Creates an empty Graph object. 
af 

Graph () ; 
/* 


* Destructor: 


* Frees the internal storage allocated to represent the graph. 


*/ 
~Graph () ; 
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Method: size 
Usage: int size - g.size(); 


Returns the number of nodes in the graph. 
x 


int size() const; 


Method: isEmpty 
Usage: if (g.isEmpty()) 


Returns true if the graph is empty. 
sa 


bool isEmpty() const; 


/* 
* Method: clear 
Usage: g.clear(); 


Reinitializes the graph to be empty, freeing any heap storage. 
"y 


void clear(); 


Method: addNode 
Usage: g.addNode (name); 
g. addNode (node) ; 


Adds a node to the graph. The first form creates the node from 

the name. The second form takes a node pointer created by the client. 
Both forms return a pointer to the added node, although that value is 
typically ignored. 


NodeType *addNode (std::string name); 
NodeType *addNode (NodeType *node); 


Method: removeNode 
Usage: g.removeNode (name); 
g.removeNode (node) ; 


Removes a node from the graph, where the node can be specified 
either by its name or as a pointer value. Removing a node also 
removes all arcs that contain that node. 


void removeNode (std::string name) ; 
void removeNode (NodeType *node) ; 


Method: getNode 
Usage: NodeType *node = g.getNode (name); 


Looks up a node in the name table attached to the graph and 
returns a pointer to that node. If no node with the specified 
name exists, getNode returns NULL. 


NodeType *getNode(std::string name) const; 


Method: addArc 

Usage: g.addArc(sl, s2); 
g.addArc(n1, n2); 
g.addArc (arc); 


Adds an arc to the graph. The endpoints of the arc can be specified 
either as strings indicating the names of the nodes or as pointers tc 
the node structures. All versions return a pointer to the added arc, 
although that value is typically ignored. 
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ArcType *addArc(std::string sl, std::string s2); 
ArcType *addArc(NodeType *nl, NodeType *n2); 
ArcType *addArc(ArcType *arc); 


Method: removeArc 

Usage: g.removeArc(sl, s2); 
g.removeArc(nl, n2); 
g.removeArc (arc); 


Removes an arc from the graph, where the &rc can be specified in any 
of three ways: by the names of its endpoints, by the node pointers 
at its endpoints, or as an arc pointer. If more than one arc 
connects the specified endpoints, all of them are removed. 


void removeArc(std::string sl, std::string s2); 
void removeArc (NodeType *nl, NodeType *n2); 
void removeArc(ArcType *arc); 


Method: isConnected 
* Usage: if (g.isConnected(sl, s2)) 
if (gd.isConnected(nl, n2)) 


* Returns true if the graph contains an arc between the specified nodes. 
Nodes can be specified either by name or as pointers to node objects. 


bool isConnected(std::string sl, std::string s2) const; 
bool isConnected(NodeType *n1, NodeType *n2) const; 


* Method: getNodeSet 
Usage: for (NodeType *node : g.getNodeSet ()) 


Returns the set of all nodes in the graph. 
wf 


Set«NodeType *» & getNodeSet () ; 


Method: getArcSet 

Usage: for (ArcType *arc : g.getArcSet()) 
for (ArcType *arc : g.getArcSet (node)) 
for (ArcType *arc : g.getArcSet (name)) 


Returns the set of all arcs in the graph or, in the second and 
* third forms, the arcs that start at the specified node, which 
* can be indicated either as a pointer or by name. 


my 


Set<ArcType *» & getArcSet(); 
Set«ArcType *> & getArcSet (NodeType *node); 
Set«ArcType *> & getArcSet(std::string name); 


/* ~ 
* Method: getNeighbors 
* Usage: for (NodeType *node : g.getNeighbors (node) ) 
for (NodeType *node : g.getNeighbors (name) ) 


* Returns the set of nodes that are neighbors of the specified 
* node, which can be indicated either as a pointer or by name. 


Set<NodeType *> getNeighbors (NodeType *node) ; 
Set<NodeType *> getNeighbors (std::string node); 


/* 
* Methods: copy constructor and assignment operator 


* These methods implement deep copying for graphs. 
*/ 
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Graph(const Graph & src); 
const Graph & operator-(const Graph & src); 


类 的 私有 部 分 。 
HN 
类 的 实现 。 


#endif 


图 18-8 (4) 


Graph 类 的 私有 部 分 需要 节点 集合 、 弧 集合 ， 以 及 一 种 能 将 节点 名 映射 到 相应 节点 的 
数据 结构 。 该 类 中 的 私有 部 分 内 容 如 图 18-9 所 示 。Graph 类 的 实现 比 其 他 集合 类 实现 更 简 
单一 些 ， 因 为 它 将 很 多 的 复杂 性 都 转移 给 了 基于 图 的 Set 类 和 Map 类。Graph 类 的 代码 
如 图 18-10 所 示 。 


Notes on the representation 


The Graph class is built as a layered abstraction on top of the Set 
and Map classes. Most of the complexity appears in the underlying 
implementations. 


private: 


/* Instance variables */ 


Set«NodeType *» nodes; /* The set of nodes in the graph */ 
Set«ArcType *» arcs; /* The set of arcs in the graph */ 
Map«std::string,NodeType *» nodeMap; /* A map from names and nodes sf 


Private methods */ 


void deepCopy (const Graph & src); 
NodeType *getExistingNode (std::string name) const; 





图 18-9 Graph 类 的 私有 部 分 


Implementation notes: Graph constructor and destructor 


The only initialization required at this level is creating empty data 
structures, which is performed automatically by the underlying classes. 
The destructor, however, must free the individual arc and node 
structures as well. Calling clear is sufficient to accomplish this task. 


/ 


template «typename NodeType,typename ArcType> 
Graph«NodeType,ArcType»::Graph() ( 

/* Empty */ 
) 


template «typename NodeType,typename ArcType» 
Graph«NodeType,ArcType»::-Graph() { 
clear(); 


) 


Implementation notes: size, isEmpty 


These methods are defined in terms of the node set, so the Graph 
class simply forwards the requests to the Set class. 





图 18-10 Graph 类 的 实现 
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template <typename NodeType,typename ArcType> 
int Graph«NodeType,ArcType»::size() const { 
return nodes.size(); 


) 


template «typename NodeType,typename ArcType» 

bool Graph«NodeType,ArcType»::isEmpty() const ( 
return nodes.isEmpty(); 

) 


/* 


* Implementation notes: clear 


* The implementation of clear frees all nodes and arcs. 


of 


template <typename NodeType,typename ArcType> 
void Graph«NodeType,ArcType»::clear() ( 
for (NodeType *node : nodes) { 
delete node; 
) 
for (ArcType *arc : arcs) ( 
delete arc; 
) 
arcs.clear(); 
nodes.clear(); 
nodeMap.clear(); 


) 


/ 
/ 


Implementation notes: addNode 


The addNode method adds the node to the set of nodes for the graph and 
to the map from names to nodes. 


/* 
* 
Wicca tien !"—————— 
* 
* 
* 


/ 


template «typename NodeType,typename ArcType» 
NodeType *Graph«NodeType,ArcType»::addNode(std::string name) ( 
if (nodeMap.containsKey (name)) { 
error("addNode: Node " + name + " already exists"); 
) 
NodeType *node - new NodeType(); 
node-»name - name; 
return addNode (node); 


) 


template «typename NodeType,typename ArcType> 

NodeType *Graph«NodeType,ArcType»::addNode(NodeType *node) { 
nodes . add (node) ; 
nodeMap [node->name] = node; 
return node; 


Implementation notes: removeNode 


The removeNode method removes the specified node but must also 
remove any arcs in the graph containing the node. To avoid 
changing the node set during iteration, this implementation 
creates a vector of arcs that require deletion. 


/ 


template «typename NodeType,typename ArcType» 
void Graph«NodeType,ArcType»::removeNode(std::string name) ( 
removeNode (getExistingNode (name)); 


) 


template «typename NodeType,typename ArcType> 
void Graph«NodeType,ArcType»::removeNode(NodeType *node) { 
Vector«ArcType *> toRemove; 
for (ArcType *arc : arcs) { 
if (arc-»start == node || arc->finish == node) { 
toRemove.add (arc); 


) 
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for (ArcType *arc : toRemove) ( 
removeArc (arc); 


) 


nodes.remove (node); 


Implementation notes: getNode, getExistingNode 


The getNode method simply looks up the name in the map, which correctly 
returns NULL if the name is not found Other methods in the 
implementation call the private method getExistingNode instead 

which checks for a NULL value and signals an error 


template «typename NodeType,typename ArcType> 
NodeType *Graph«NodeType,ArcType»::getNode(std::string name) const { 
return nodeMap.get (name); 


) 


template «typename NodeType,typename ArcType» 

NodeType *Graph«NodeType,ArcType»::getExistingNode(std::string name) const { 
NodeType *node - nodeMap.get (name); 
if (node == NULL) error("No node named " + name); 
return node; 


Implementation 


addArc method appears orms s described in the interface 


template <typename NodeType,typename ArcType> 
ArcType *Graph«NodeType,ArcType»::addArc(std::string sl, std::string s2) ( 
return addArc(getExistingNode(sl), getExistingNode(s2)); 


) 


template «typename NodeType,typename ArcType> 
ArcType *Graph«NodeType,ArcType»::addArc(NodeType *nl, NodeType *n2) ( 
ArcType *arc - new ArcType(); 
arc-»start - nl; 
arc-»finish = n2; 
return addArc (arc); 
) 


template «typename NodeType,typename ArcType> 

ArcType *Graph«NodeType,ArcType»::addArc(ArcType *arc) ( 
arc-»start-»arcs.add(arc); 
arcs.add(arc); 
return arc; 


Implementation notes: removeArc 


These methcds remove arcs from the graph, which is ordinarily a simple 
matter of removing the arc from two sets: the set of arcs in the graph 
as a whole and the set of arcs in the starting node. The methods that 
remove an arc specified by its endpoints, however, must take account of 
the possibility that there is more than one arc and remove ail of them 


template «typename NodeType,typename ArcType> 

void Graph«NodeType,ArcType»::removeArc(std::string sl, std::string s2) ( 
removeArc(getExistingNode(s1), getExistingNode (s2)); 

) 


template «typename NodeType,typename ArcType» 
void Graph«NodeType,ArcType»::removeArc(NodeType *nl, NodeType *n2) { 
Vector«ArcType *» toRemove; 
for (ArcType *arc : arcs) ( 
if (arc-»start == nl && arc-»finish == n2) ( 
toRemove.add(arc); 
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) 
} 
for (ArcType *arc : toRemove) { 
removeArc (arc) ; 
} 
) 


template «typename NodeType,typename ArcType» 

void Graph«NodeType,ArcType»::removeArc(ArcType *arc) { 
arc-»start-»arcs.remove (arc); 
arcs.remove (arc); 


) 
/* 


* Implementation notes: isConnected 


* Node nl is connected to n2 if any of the arcs leaving nl finish at n2. 


+7 


template «typename NodeType, typename ArcType> 
bool Graph«NodeType,ArcType»::isConnected(std::string sl, 
std::string s2) const ( 
return isConnected(getExistingNode (s1), getExistingNode(s2)); 


) 


template «typename NodeType,typename ArcType» 
bool Graph«NodeType,ArcType»::isConnected(NodeType *ni, NodeType *n2) const 
for (ArcType *arc : nl-»arcs) { 
if (arc-»finish -- n2) return true; 


) 


return false; 


Implementation notes: getNodeSet, getArcSet 


* These methods simply return the set requested by the client. For 


* efficiency, the sets are returned by reference, because doing so 
* eliminates the need to copy the set. 


ui 


template <typename NodeType,typename ArcType> 
Set«NodeType *> & Graph<NodeType,ArcType>::getNodeSet () { 
return nodes; 


) 


template «typename NodeType,typename ArcType> 
Set<ArcType *> & Graph«NodeType,ArcType»::getArcSet() { 
return arcs; 


} 


template <typename NodeType,typename ArcType> 
Set<ArcType *> 6 Graph<NodeType,ArcType>::getArcSet (NodeType *node) { 
return node-»arcs; 


) 


template «typename NodeType,typename ArcType» 
Set«ArcType *» & Graph«NodeType,ArcType»::getArcSet(std::string name) ( 
return getArcSet (getExistingNode (name)); 


) 
/* 


* Implementation notes: getNeighbors 


This implementation recomputes the set each time, which is reasonably 
efficient if the degree of the node is small. 
=f 


template <typename NodeType, typename ArcType> 
Set«NodeType *> Graph<NodeType,ArcType>: :getNeighbors (NodeType *node) { 
Set<NodeType *> nodes; 
for (ArcType *arc : node-»arcs) { 
nodes .add(arc->finish) ; 
} 


return nodes; 
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) 


template «typename NodeType,typename ArcType» 
Set«NodeType *» Graph<NodeType, ArcType>: :getNeighbors (std::string name) 
return getNeighbors (getExistingNode (name) ) ; 


} 
/* 


* Implementation notes: copy constructor and assignment operator 


* These methods ensure that copying a graph creates an entirely new 
* parallel structure of nodes and arcs. 


x7 


template «typename NodeType,typename ArcType» 
const Graph<NodeType,ArcType> & 
Graph«NodeType,ArcType»::operator-(const Graph & src) { 
if (this !- &src) ( 
clear(); 
deepCopy (src); 
} 
return *this; 


} 


template <typename NodeType, typename ArcType> 

Graph«NodeType,ArcType»::Graph(const Graph & src) { 
deepCopy (src) ; 

) 


Private method: deepCopy 


This method reallocates all the nodes and arcs to ensure that the 
* structures are disjoint. 
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template «typename NodeType,typename ArcType» 
void Graph«NodeType,ArcType»::deepCopy(const Graph & other) { 
for (NodeType *oldNode : other.nodes) ( 
NodeType *newNode - new NodeType(); 
*newNode = *oldNode; 
newNode-»arcs.clear(); 
addNode (newNode) ; 
) 
for (ArcType *oldArc : other.arcs) { 
ArcType *newArc - new ArcType(); 
*newArc - *oldArc; 
newArc-»start = getExistingNode (oldArc-»start-»name); 
newArc-»finish = getExistingNode (oldArc-»finish-^»name); 
addArc (newArc) ; 





图 18-10 (4) 


(186 寻找 最 短路 径 


很 多 重要 的 商业 应 用 都 会 涉及 图 ， 因 此 ， 人 们 花费 了 巨大 的 努力 来 寻找 图 相关 问题 的 高 
效 算 法 。 在 这 些 问题 中 ， 一 个 特别 有 意思 的 问题 就 是 在 图 中 寻找 一 条 路 径 ， 使 得 按照 某 种 标 
准 评估 时 其 路 径 上 的 两 个 节点 之 间 有 最 小 的 代价 。 这 个 标准 不 一 定 是 经 济 学 上 的 。 尽 管 对 于 
特定 的 应 用 而 言 ， 你 可 能 对 寻找 两 个 节点 之 间 最 低 的 花费 路 径 感 兴趣 。 你 可 以 使 用 同样 的 算 
法 找到 一 个 最 短 距离 的 路 径 、 最 少 的 跳跃 次 数 或 者 最 短 的 遍历 时 间 。 

作为 一 个 具体 的 实例 ， 假 设 你 想 找 到 San Francisco 与 Boston 之 间 总 距离 最 短 的 路 径 ， 可 
以 用 图 18-2 在 弧 上 所 示 的 里 程 数 值 计算 。 它 应 该 经 过 Portland 和 Seattle， 还 是 经 过 Dallas, 
Atlanta 和 New York 呢 ? 或 是 可 能 还 存在 一 些 不 明显 但 确实 距离 更 短 的 路 径 呢 ? 

对 于 像 航 线 图 一 样 简单 的 路 线 图 ， 通 过 沿 着 可 能 的 路 径 把 所 有 弧 的 距离 相 加 就 能 很 容易 
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地 计算 出 结果 。 然 而 ， 随 着 图 的 增 大 ， 这 种 方法 就 不 可 行 了 。 通常 ， 图 中 两 个 节点 之 间 的 路 
径 数 是 以 指数 级 增长 的 ， 这 也 意味 着 探索 所 有 路 径 方法 的 时 间 复 杂 度 为 0 (2")。 正 如 第 10 
章 中 复杂 度 计算 所 讨论 的 那样 ， 指 数 级 的 问题 算法 是 不 可 行 的 。 如 果 你 想 在 一 个 合理 的 时 间 
内 找 出 图 中 的 最 短路 径 ， 使 用 更 高 效 的 算法 非常 必要 。 

在 图 中 寻找 最 短路 径 最 常用 的 算法 是 Edsger W. Dijkstra 于 1959 年 提出 的 Dijkstra 算法 ， 
它 是 一 个 贪心 算法 (greedy algorithm) 的 特例 。 贪 心算 法 可 以 让 你 通过 一 系列 逻辑 可 行 的 选 
择 找 出 所 有 的 解决 方法 。 贪 心算 法 并 非 对 每 个 问题 都 适用 ， 但 是 在 解决 最 短路 径 问 题 上 还 是 
相当 有 用 的 。 

就 本 质 而 言 ，Dijkstra 算法 的 核心 就 是 寻找 最 短路 径 ， 或 者 更 通俗 地 说 ， 就 是 找 出 那些 
具有 最 小 代价 的 弧 的 路 径 ， 可 以 对 其 做 如 下 定义 : 从 起 始 节点 开始 探索 沿 着 路 径 总 长 度 增加 
的 方向 前 进 ， 直 到 到 达 目 的 节点 。 这 个 路 径 一 定 是 最 优 的 ， 因 为 你 已 经 探索 了 起 始 节 点 到 目 
的 节点 的 代价 较 小 的 所 有 路 径 。 在 寻找 最 短路 径 的 问题 中 ，Dijkstra 算法 可 以 用 图 18-11 中 
的 方式 实现 。 


* Function: findShortestPath 
Usage: Vector«Arc *» path - findShortestPath(start, finish); 


Finds the shortest path between the nodes start and finish using 
Dijkstra's algorithm, which keeps track of the shortest paths in 
a priority queue The function returns a vector of arcs, which is 
émpty if start and finish are the same node or if no path exists 


/ 


Vector«Arc *» findShortestPath(Node *start, Node *finish) ( 
Vector«Arc *» path; 
PriorityQueue« Vector<Arc *> > queue; 
Map<string,double> fixed; 
while (start != finish) { 
if (!fixed.containsKey(start-»name)) { 
fixed.put(start-»name, getPathCost (path)); 
for (Arc *arc : start-»arcs) ( 
if (!fixed.containsKey(arc-»finish-»name)) { 
path.add(arc); 
queue .enqueue (path, getPathCost (path)); 
path.remove(path.size() - 1); 
) 
) 
) 
if (queue.isEmpty()) ( 
path.clear(); 
return path; 
) 
path - queue.dequeue(); 
start = path[path.size() - 1]-»finish; 
) 


return path; 


Function: getPathCost 
Usage: double cost = getPathCost (path); 


* Returns the total cost of the path, which is just the sum of the 
costs of the arcs 


double getPathCost(const Vector<Rrc *» & path) { 
double cost - 0; 
for (Arc *arc : path) { 


cost += arc-»cost; 
) 


return cost; 





图 18-11 寻找 最 短路 径 的 Dijkstra 算法 实现 


804 


540 P 18 Ž 


如 果 你 认真 考虑 findShortestPath 算法 所 使 用 的 数据 结构 ， 对 该 算法 的 理解 就 会 
更 深入 一 些 。 在 该 算法 实现 中 定义 了 以 下 三 个 局 部 变量 : 

e "FÉ path 用 来 追踪 最 短路 径 ， 它 由 弧 矢 量 构 成 。 矢 量 中 的 第 一 个 弧 由 开始 节 
点 指向 第 一 个 中 间 节 点 。 每 一 个 子路 径 都 在 前 一 个 路 径 结 束 时 开始 ， 然 后 继续 
前 进 ， 直 到 它 最 后 一 个 弧 的 终点 到 达 目 的 节点 。 如 果 两 个 节点 之 间 不 存在 路 径 ， 
findShortestPath 返回 空 矢量 来 表示 这 一 事实 。 

e 变量 queue 是 弧 的 一 个 有 序 队列 ， 因此 队列 中 的 弧 是 按照 代价 递增 的 顺序 排列 的 。 
因此 ,该 队列 不 同 于 传统 的 先进 先 出 的 规则 ， 它 是 一 个 优先 队列 (priority queue). 
这 个 队列 允许 用 户 定义 每 个 元 素 的 优先 级 。findshortestPath 的 代码 假定 这 个 
功能 已 经 在 PriorityQueue 类 中 实现 了 ， 如 第 16 SHANA. BRS enqueue 
方法 ，PriorityQueue 与 标准 Queue 类 完全 相同 。enqueue 方法 用 其 第 二 个 参 
数 指明 优先 级 ， 其 方法 原型 如 下 : 


void enqueue (ValueType element, double priority); 


与 传统 的 英语 含义 相同 ， 在 优先 队列 中 ， 优 先 级 小 的 数字 会 首先 出 现在 队列 中 ， 因 
此 优先 级 为 1 的 元 素 会 在 优先 级 为 2 的 元 素 之 前 。 因 为 所 有 的 路 径 都 按照 距离 进入 
了 优先 序列 ， 每 次 dequeue 的 调用 都 会 返回 队列 中 存在 的 最 短路 径 。 标 准 的 C++ 
类 库 通 过 pqueue .h 接口 输出 PriorityQueue 类 。 

e 变量 fixed 是 一 个 映射 ， 它 将 每 个 城市 名 与 到 达 那 个 城市 的 已 知 的 最 短 距离 相 
关联 。 当 你 从 优先 队列 中 删除 一 条 路 径 时 ， 你 就 能 知道 抵达 该 路 径 终 节点 的 最 短 
路 径 ， 除 非 你 已 经 发 现 了 最 短路 径 。 并 且 你 知道 该 路 径 是 目前 已 知 的 最 短 距离 的 
路 径 。 

findShortestPath 的 操作 显示 在 图 18-12 中 ， 它 展示 了 在 图 18-2 的 航线 图 中 从 San 

Francisco 到 Boston 的 最 短路 径 的 计算 步骤 。 


确定 到 San Francisco 的 距离 为 0 
处 理 从 San Francisco 射出 的 弧 的 顶点 的 集合 (Dallas, Denver, Portland) 
将 路 径 San Francisco — Dallas (1468 ) APA 
将 路 径 San Francisco — Denver (954) 入 队 
将 路 径 San Francisco — Portland (550) ABA 
将 最 短路 径 San Francisco — Portland (550) 出 队 
确定 到 Portland 的 距离 为 550 
处 理 从 Portland 射出 的 弧 的 顶点 的 集合 (San Francisco, Seattle) 
忽略 San Francisco， 因 为 Portland 到 它 的 距离 已 知 
将 路 径 San Francisco — Portland 一 Seattle(680) 人 队 
将 最 短路 径 San Francisco — Portland — Seattle (680) 出 队 
确定 到 Seattle 的 距离 为 680 
处 理 从 Seattle 射出 的 弧 的 顶点 的 集合 (Boston, Portland) 
将 路 径 San Francisco — Portland — Seattle — Boston (3169) 入 队 
忽略 Portland, 因为 Seattle 到 它 的 距离 已 知 
将 最 短路 径 San Francisco 一 Denver (954) 出 队 
确定 到 Denver 的 距离 为 954 





图 18-12 Dijkstra 算法 的 执行 步骤 
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处 理 从 Denver 射出 的 弧 的 顶点 的 集合 (Chicago, Dallas, San Francisco) 
忽略 San Francisco, 因为 Denver 到 它 的 距离 已 知 
将 路 径 San Francisco 一 Denver — Chicago (1861) 入 队 
将 路 径 San Francisco — Denver — Dallas (1604) ÀA BA 
将 最 短路 径 : San Francisco — Dallas (1468) 出 队 
确定 到 Dallas 的 距离 为 1468 
处 理 从 Dallas 发 出 的 弧 的 项 点 的 集合 (Atlanta, Denver, Los Angeles, San Francisco) 
忽略 Denver 和 San Francisco, 因为 Dallas 到 它们 的 距离 已 知 
， 将 路 径 San Francisco — Dallas — Atlanta (2193) ABA 
将 路 径 San Francisco 一 Dallas — Los Angeles (2708) 入 队 
将 最 短路 径 San Francisco 一 Denver — Dallas (1604) 出 队 
忽略 Dallas， 因 为 它 的 距离 已 知 
将 最 短路 径 San Francisco — Denver — Chicago (1861) 出 队 
确定 到 Chicago 的 距离 为 1861 
处 理 从 Chicago 发 出 的 弧 的 顶点 的 集合 (Atlanta, Denver) 
忽略 Denver, 因为 Chicago 到 它 的 距离 已 知 
将 路 径 San Francisco 一 Denver — Chicago — Atlanta (2460) 人 队 
将 最 短路 径 San Francisco — Dallas — Atlanta (2193) 出 队 
确定 到 Atlanta 的 距离 为 2193 
处 理 从 Atlanta 发 出 的 弧 的 顶点 的 集合 (Chicago, Dallas, New York) 
忽略 Chicago 和 Dallas, 因为 Atlanta 到 它们 的 距离 已 知 
将 路 径 San Francisco 一 Dallas 一 Atlanta 一 New York (2949) 入 队 
将 最 短路 径 San Francisco 一 Denver — Chicago 一 Atlanta (2460) 出 队 
忽略 Atlanta, 因为 它 的 距离 已 知 
将 最 短路 径 San Francisco — Dallas — Los Angeles (2708) 出 队 
确定 到 Los Angeles 的 距离 为 2708 
处 理 从 Los Angeles 发 出 的 弧 的 顶点 的 集合 (Dallas) 
忽略 Dallas, 因为 Los Angeles 到 它 的 距离 已 知 
将 最 短路 径 San Francisco 一 Dallas — Atlanta 一 New York (2949) 出 队 
确定 到 New York 的 距离 为 2949 
处 理 从 New York 发 出 的 弧 的 项 点 的 集合 (Atlanta, Boston) 
忽略 Atlanta, 因为 New York 到 它 的 距离 已 知 
将 路 径 San Francisco — Dallas — Atlanta 一 New York — Boston (3140) 入 队 
将 最 短路 径 San Francisco 一 Dallas — Atlanta — New York — Boston (3140) 出 队 














图 18-12 (4E) 


在 你 阅读 Dijkstra 算法 的 实现 时 ， 牢 记 以 下 几 点 是 非常 有 用 的 : 

e 路 径 是 按照 距离 的 远近 而 不 是 按照 跳跃 的 次 数 进行 探索 的 。 因 此 ，San Francisco 
Portland Seattle 的 探索 会 在 San Francisco — Denver M# San Francisco 一 
Dallas 之 前 ， 因 为 它 的 总 距离 更 短 。” 

e 当 一 条 路 径 出 队列 而 不 是 进 队 列 时 ， 到 达 一 个 节点 的 距离 是 国定 的 。 在 优先 队列 中 
到 达 Boston 的 第 一 条 路 径 为 通过 Portland 和 Seattle 的 路 径 ， 这 不 是 可 能 的 最 短路 径 。 
San Francisco Portland > Seattle > Boston 的 总 距离 为 3169。 由 于 最 短 
距离 仅 为 3140， 因 此 ， 算 法 执行 完 后 ,San Francisco 一 Portland 一 Seattle 一 
Boston 这 条 路 径 仍然 会 在 优先 队列 中 。 
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e 每 个 节点 的 弧 最 多 遍历 一 次 。 当 到 达 某 个 节点 的 距离 确定 时 ， 算 法 的 内 部 循环 才 会 
执行 。 对 于 每 个 节点 而 言 ， 这 个 只 会 发 生 一 次 。 因 此 ， 最 终 执行 内 部 循环 的 次 数 就 
是 从 之 前 节点 到 最 后 节点 的 节点 和 弧 的 最 小 个 数 。Dijkstra 算法 的 完整 分 析 超 越 了 本 
书 的 范围 ， 但 是 它 的 运行 时 间 为 O (M log N), Kb, NIGRAE, M 的 值 为 N 
和 弧 数 中 的 最 大 值 。 


18.7 ”搜索 网 页 的 算法 


正如 本 章 引言 部 分 所 述 ， 网 页 也 是 一 个 图 ， 其 中 节点 就 是 一 个 网 页 ， 而 弧 是 可 以 从 一 个 
网 页 跳 转 到 男 一 个 网 页 的 超 链接 。 但 是 和 你 在 本 章 所 见 到 的 图 不 同 的 是 ， 网 页 图 是 巨大 的 。 
网 络 中 网 页 的 个 数 是 数 十 亿 的 ， 链 接 的 数量 也 是 如 此 。 

为 了 在 大 量 的 网 页 集合 中 找到 有 用 的 东西 ， 很 多 人 会 使 用 搜索 引擎 来 产生 你 可 能 感 兴趣 
的 网 页 的 序列 。 典 型 的 搜索 引擎 是 遍历 整个 Web 上 的 网 页 ， 这 个 过 程 称 为 惫 取 (crawling), 
它 可 以 通过 多 台 计 算 机 并 行 执行 ， 然 后 通过 这 些 信 息 创 建 一 个 索引 确定 哪个 网 页 包含 一 个 特 
定 的 单词 或 短语 。 然 而 ， 鉴 于 网 页 的 规模 ， 单 靠 索 引 是 不 够 的 。 除 非 查询 关键 词 是 非常 准确 
的 ， 否 则 包含 查询 关键 词 的 网 页 数量 是 惊人 的 。 因 此 ， 搜 索引 擎 必须 对 搜索 结果 进行 排序 ， 
以 使 得 分 较 高 的 网 页 出 现在 查询 结果 的 较 前 面 。 设 计 一 个 有 效 的 搜索 引擎 最 大 的 挑战 就 是 设 
计 一 个 可 以 对 每 个 网 页 的 重要 性 进行 评估 打分 的 算法 。 


18.7.1 谷歌 的 网 页 排名 算法 


对 网 页 进行 排序 的 最 著名 的 算法 就 是 谷歌 的 网 页 排名 算法 ( PageRank algorithm)， 它 基于 
Web 网 页 的 链接 结构 而 将 整个 Web 看 成 为 一 张 图 ， 每 个 网 页 都 被 赋予 一 个 分 值 以 反映 它 在 图 
中 的 重要 性 。 尽 管 它 的 名 称 暗 示 了 对 网 页 排序 的 想法 ，PageRank 算法 其 实 是 以 拉 里 : fi 
奇 命名 的 ， 他 和 谷歌 的 共同 创始 人 谢 尔 盖 : 布 林 一 起 设计 了 这 个 算法 ， 并 且 两 人 都 毕业 于 斯 
坦 福 大 学 。 

从 某 种 程度 上 说 ，PageRank 算法 背后 的 思想 很 简单 ， 如 果 其 他 的 网 页 与 某 个 网 页 相 链 
接 时 ， 这 个 网 页 就 会 变 得 更 重要 。 因 此 ， 依 据 网 页 间 的 相互 链接 ，Web 中 的 每 个 网 页 都 得 到 
一 个 分 值 。 然 而 ， 所 有 的 链接 并 不 处 于 同一 层次 。 从 一 个 较为 权威 的 网 页 来 的 链接 的 权 值 要 
高 于 非 权 威 网 页 的 链接 值 。 这 形成 了 对 网 页 重要 性 更 具体 的 刻画 : 如 果 一 个 网 页 和 重要 的 网 
页 间 有 链接 ， 则 该 网 页 变 得 更 重要 。 

网 页 的 重要 性 会 随 着 和 它 链 接 的 网 页 的 重要 性 而 变化 ， 这 一 事实 意味 着 网 页 的 得 分 会 随 
着 其 他 网 页 得 分 的 波动 而 上 下 起 伏 。 因 此 ，PageRank 算法 按照 一 系列 的 逐次 通 近 进行 网 页 
得 分 的 计算 。 首 先 ， 所 有 的 网 页 都 赋予 相同 的 权 值 。 在 算法 后 期 的 迭代 中 ， 每 个 网 页 的 得 分 
会 随 着 和 它 链 接 的 网 页 的 得 分 而 进行 调整 。 最 后 ， 这 个 过 程 就 会 达到 一 个 平衡 点 ， 此 时 每 个 
网 页 都 会 按 网 络 的 链接 结构 计算 出 反映 它 的 重要 性 的 得 分 。 

另外 一 个 描述 PageRank 算法 效果 的 方法 为 : 每 个 网 页 的 最 后 得 分 代表 随机 链接 到 达 
那个 网 页 的 可 能 性 。 采 用 随机 选择 而 不 考虑 之 前 的 决策 结果 的 过 程 被 称 为 马尔 可 夫 过 程 
(Markov processes)， 它 以 俄国 数学 家 安 德 烈 . 马尔 可 夫 命 名 的 ， 马 尔 可 夫 (1856—1922) 
是 率先 分 析 这 种 过 程 的 数学 性 质 的 数学 家 之 一 。 


图 543 


18.7.2 ”网 页 排名 算法 的 一 个 简 例 

鉴于 真实 的 网 络 太 大 而 不 能 作为 一 个 有 效 的 示例 ， 因 此 ， 用 一 个 较 小 的 例子 开始 是 很 合 
理 的 。 图 18-13 所 示 的 图 就 代表 了 由 五 个 网 页 构成 的 一 个 简单 网 络 ， 图 中 的 网 页 用 A、B、C、 
DAE tic. 例如，A 网 页 和 其 他 网 页 都 有 链接 ， 而 网 页 B 仅仅 和 网 页 E 有 链接 。 





图 18-13 具有 等 概率 的 初始 的 五 个 网 页 的 Web 图 


PageRank 算法 的 第 一 步 就 是 给 每 个 网 页 赋 一 个 初始 的 分 值 ， 它 是 一 个 简单 的 概率 值 ， 代 
表 在 整个 网 页 中 随机 地 选择 某 个 网 页 的 可 能 性 。 例 如 ， 在 本 例 中 有 五 个 网 页 ， 因 此 每 个 特定 网 
页 被 随机 选中 的 概率 均 为 五 分 之 一 。 用 数学 方式 来 描述 就 是 0.2， 这 个 概率 值 出 现在 每 个 网 页 
名 的 底部 。 

在 算法 的 每 次 迭代 中 ，PageRank 算法 都 会 通过 计算 用 户 从 先前 循环 按照 随机 链接 更 新 
给 各 个 网 页 所 赋 的 可 能 性 值 。 例 如 ， 你 恰好 在 A 节点 上 ， 你 就 可 以 选择 访问 其 他 任意 四 个 节 
. 点 ， 因 为 A 和 它们 都 有 链接 。 如 果 你 随机 选择 一 个 链接 ， 则 你 去 B 网 页 的 概率 为 四 分 之 一 ， 
去 C 也 为 四 分 之 一 ， 去 D 和 EE 也 是 四 分 之 一 。 然 而 ， 如 果 你 在 节点 B 呢 ? 由 于 节点 B 只 有 
一 个 链接 ， 任 何在 B 网 页 中 的 用 户 都 会 无 一 例外 的 到 达 E 网 页 。 

你 可 以 使 用 这 种 计算 方法 确定 从 某 个 特定 节点 开始 到 达 其 他 任意 节点 的 概率 。 例 如 ， 有 
两 种 通过 链接 到 A 网 页 的 方法 。 你 可 以 从 c 网 页 开始 ， 然 后 在 C 网 页 的 两 个 链接 中 选择 那 
个 返回 A 节点 的 链接 。 此 外 ,你 也 可 以 从 DD 节点 开始 ， 但 这 样 的 话 只 有 你 足够 幸运 才能 从 
D 的 三 个 链接 中 选 出 到 A 的 链接 ， 而 不 是 其 他 节点 的 链接 。 如 果 你 将 这 种 计算 用 公式 表示 ， 
用 有 标示 的 字母 表示 到 下 一 个 节点 的 可 能 性 ，A 节点 的 计算 公式 如 下 : 

A=4C+4D 

AAA POT, ATA FERT AAA 

B'=4A+4C+4D+4E 
C-liA-iD 
D-iA-LE 
E=+A+B 

算法 的 每 一 次 迭代 都 会 用 公式 计算 出 的 A'、B'、c'、D'、E' RRE A, BL C. D, Es 
网 页 排序 算法 执行 了 两 次 迭代 的 结果 如 图 18-14 所 示 。 
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Fl 18-14 PageRank 算法 头 两 次 迭代 后 各 个 节点 的 概率 
现实 生活 中 ,马尔 可 夫 过 程 最 有 趣 的 就 是 在 适当 的 迭代 后 结果 会 趋 于 稳定 。 图 18-15 展 
示 了 经 过 16 次 迭代 之 后 五 个 节点 的 概率 。 此 时 概率 的 前 三 个 小 数位 不 会 再 发 生变 化 。 因 此 ， 
那些 值 就 能 表示 随机 浏览 时 到 达 该 特定 网 页 的 可 能 性 ， 这 也 是 PageRank 算法 的 本 质 。 





图 18-15 ”达到 稳定 的 各 个 节点 的 概率 


本 章 小 结 


本 章 向 你 介绍 了 图 的 概念 。 它 被 定义 为 由 一 系列 弧 相 连 的 节点 的 集合 。 与 集合 一 样 ， 图 
不 仅 是 一 种 重要 的 抽象 理论 ， 也 是 一 个 解决 很 多 应 用 领域 中 出 现 的 实际 问题 的 工具 。 例 如 ， 
图 算法 在 研究 因特网 到 大 型 的 交通 系统 这 些 相互 联系 结构 的 性 质问 题 时 特别 有 用 。 
本 章 的 重点 包括 : 
。 图 可 以 是 有 向 的 或 无 向 的 。 有 向 图 的 弧 只 能 有 一 个 方向 ， 因 此 ， 关 存在 ni 一 nz 这 条 
弧 ， 并 不 能 说 明 也 存在 n; — m 这 条 弧 。 你 可 以 用 有 向 图 来 表示 无 向 图 ， 即 在 有 向 图 
中 用 两 个 反 向 弧 来 表示 一 对 节点 之 间 的 双向 关系 。 
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你 可 以 采取 任 一 种 策略 来 表示 图 中 的 关系 。 一 个 常用 的 方法 就 是 构建 一 个 邻接 链表 ， 
此 时 ， 每 个 节点 的 数据 结构 是 一 个 相互 连接 的 节点 的 列表 。 你 也 可 以 使 用 一 个 邻接 
和 矩阵， 它 将 节点 间 的 联系 存 人 到 一 个 二 维 布尔 数组 中 。 其 中 ,和气 阵 的 行 或 列表 示 图 [812 
中 的 各 节点 ; 车 在 图 中 两 个 节点 相连 ， 则 和 矩阵 中 节点 对 应 的 行 与 列 的 值 为 true。 
采用 集合 分 层 的 思想 ，graph.h 接口 可 以 被 较 容易 地 实现 。 虽 然 我 们 可 能 用 完全 低 
层 的 基于 结构 的 方式 ， 或 者 高 层 的 完全 面向 对 象 的 方式 来 定义 这 个 接口 ， 但 是 我 们 
最 好 采用 一 种 折 中 的 方法 来 定义 Graph 类 ， 但 应 将 Graph 类 中 所 使 用 的 节点 和 弧 
的 结构 留 给 用 户 去 定义 。 

图 最 重要 的 两 个 遍历 顺序 是 深度 优先 搜索 和 广度 优先 搜索 。 深 度 优先 算法 从 起 始 节 
点 选择 弧 ， 然 后 从 这 个 弧 开 始 逐 个 地 对 所 有 路 径 进行 遍历 操作 ,遍历 操作 持续 进行 
直到 没有 其 他 的 节点 。 只 有 到 这 时 ， 算 法 才 会 返回 到 起 始 节 点 ， 再 对 其 他 弧 进行 遍 
历 操 作 。 广 度 优先 算法 是 按照 节点 与 起 始 节点 的 距离 的 顺序 来 进行 遍历 ， 这 个 距离 
是 通过 计算 最 短路 径 中 弧 的 数量 来 确定 的 。 对 初始 节点 进行 处 理 后 ， 广 度 优先 搜索 
在 跳 到 下 两 个 节点 之 前 将 会 对 其 所 有 的 邻接 节点 进行 处 理 。 

采用 Dijkstra 算法 ， 你 可 以 找到 图 中 两 个 节点 之 间 的 最 短路 径 。 这 个 算法 比 起 比较 
所 有 可 能 路 径 的 长 短 的 指数 级 策略 其 效率 要 高 得 多 。Dijksta 算法 是 一 类 采用 贪心 算 
法 的 实例 之 一 ， 贪 心算 法 的 思想 是 在 任何 决策 点 选择 局 部 最 优 。 


复习 题 

1. 图 是 什么 ? 

2. 判断 题 : 树 是 图 的 子 集 。 

3. 有 向 图 和 无 向 图 的 区 别 是 什么 ? 

4. 假如 你 正在 使 用 某 个 仅 支 持 有 向 图 的 图 形 包 ， 你 怎样 将 无 向 图 表示 出 来 ? 

5. 给 出 下 列 术 语 在 图 中 的 定义 : 路 径 、 回 路 、 简 单 路 径 、 简 单 回路 。 

6. 相 邻 节点 和 度 的 关系 是 什么 ? 

7. 强 连接 图 和 弱 连 接 图 的 区 别 是 什么 ? 813 
8. 判断 题 : 弱 连 接 和 无 向 图 没有 实际 相关 性 ， 因 为 所 有 这 样 的 图 都 是 只 要 有 连接 就 自然 是 强 连接 的 。 
9. 数学 中 典型 的 代表 节点 和 缴 的 术语 是 什么 ? 

10. 假设 某 大 学 开设 了 八 门 计算 机 课 ， 这 些 课程 的 前 趋 后 继 关系 如 下 图 所 示 : 





采用 本 章 所 描述 的 图 的 数学 形式 ， 将 该 图 定义 为 一 对 节点 的 集合 。 
11. 画 一 个 邻接 链表 图 来 表示 复习 题 10 中 的 图 。 
12. 复习 题 10 中 的 图 ， 其 对 应 的 邻接 矩阵 中 的 内 容 是 什么 ? 
13. 稀疏 图 和 稠密 图 的 区 别 是 什么 ? 
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14. 假如 在 一 个 特定 的 应 用 中 ， 要 求 选 择 图 的 底层 表示 ， 是 什么 因素 决定 你 用 邻接 表 还 是 邻接 矩阵 来 实 
现 这 个 需求 ? 

15. 为 什么 为 一 个 图 形 包 实现 一 个 用 单独 的 迭代 器 是 不 必要 的 ? 

16. 在 graph.h 接口 的 各 个 版 本 中 ， 为 什么 使 用 的 集合 都 使 用 指向 节点 或 者 弧 的 指针 作为 它 的 元 素 类 型 ? 

17. 图 的 两 种 基本 的 遍历 操作 是 什么 ? 

18. 写 出 图 18-1 中 的 飞机 航线 图 从 Atlanta 开始 的 深度 优先 遍历 和 广度 优先 遍历 的 结果 。 假 设 节点 和 弧 
的 顺序 和 字典 顺序 相同 。 

19. 本 章 把 哪个 问题 列 成 了 包含 类 中 graph .h 接口 的 Node fll Arc 定义 的 最 重要 的 问题 ? 

20. graph .h 接口 在 定义 用 于 表示 节点 和 弧 用 户 自 定义 类 型 时 需 遵 循 什么 法 则 ? 

21. 什么 是 贪心 算法 ? 

22. 解释 Dijkstra 算法 寻找 最 短路 径 的 操作 流程 。 

23. 给 出 对 图 18-11 执行 Dijkstra 算法 时 ， 每 一 执行 步骤 所 对 应 的 优先 队列 中 的 值 。 

24. 把 图 18-12 作为 一 个 模型 ， 追 踪 Dijkstra 算法 的 执行 过 程 ， 找 出 Portland 到 Atlanta 的 最 短路 径 。 


习题 
1. 用 低层 的 、 基 于 结构 的 gzaph .h 接口 版 本 设计 并 实现 函数 ; 


void readGraph(SimpleGraph & g, istream & infile); 


函数 从 infile 读 取 一 个 描述 图 的 文本 到 用 户 传人 的 图 g 中 。 已 经 打开 的 输入 流 中 的 内 容 可 以 由 以 
下 三 种 形式 中 的 任 一 种 组 成 : 
x 定义 一 个 名 为 x 的 节点 
Xs 定义 一 个 双向 弧 X<>y 
x->y XE LAF IS UK xy 
x 和 yy 的 名 称 是 任意 不 包含 连接 符 的 字符 串 。 上 述 任意 两 种 连接 格式 也 要 允许 用 户 在 行 末 用 中 括号 
包围 数字 指定 弧 数 。 如 果 括 号 里 没有 值 ， 弧 数 默 认为 1。 图 和 文件 的 定义 用 一 个 空白 行 结尾 。 

当 在 数据 文件 中 出 现 新 名 字 时 就 定义 一 个 新 节点 。 这 样 ， 如 果 所 有 的 节点 都 和 其 他 节点 相连 ， 
在 数据 文件 中 仅仅 包含 弧 就 足够 了 ， 因 为 定义 弧 自 然 就 定义 了 节点 的 末端 。 如 果 你 需要 表示 一 个 包 
含 孤 立 节 点 的 图 ， 必 须 注 明 这 些 节点 在 数据 文件 的 不 同行 里 的 名 字 。 

当 读 取 弧 的 描述 时 ， 你 的 执行 程序 应 该 去 除 节 点 名 中 的 首尾 空格 ， 但 要 保留 节点 名 中 间 的 空 
格 。 以 下 这 行文 本 : 


San Francisco - Denver (954) 


因此 ， 它 定义 了 节点 名 为 “San Francisco" M "Denver", 然后 在 两 个 节点 之 间 建 立 双 向 连接 ， 
并 将 两 个 弧 长 被 初始 化 为 具有 代价 954。 
作为 例子 ， 对 下 列 数 据 文件 调用 readGraph 会 产生 在 本 章 中 图 18-2 所 示 的 航线 图 : 


AirlineGraph.txt 
Atlanta - Chicago (599) 


Atlanta - Dallas (725) 
Atlanta - New York (756) 


Boston - New York (191) 
Boston - Seattle (2489) 
Chicago - Denver (907) 


Dallas - Denver (650) 

Dallas - Los Angeles (1240) 
Dallas - San Francisco (1468) 
Denver - San Francisco (954) 
Portland - Seattle (130) 
Portland - San Francisco (550) 
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HPS, HEME readGraph 函数 的 功能 一 样 : 
void writeGraph(SimpleGraph & g, ostream & outfile); 


这 个 函数 要 求 输出 指定 的 输出 文件 的 图 的 文本 说 明 。 你 可 以 假设 图 中 每 个 节点 中 的 数据 区 包含 节点 
名 ， 就 如 同 readGraph 生成 了 图 。writeGraph 函数 的 输出 结果 必须 在 readGraph 中 可 读 。 

.用 一 个 栈 来 存储 未 遍历 的 节点 的 方法 蔡 代 在 图 18-5 中 的 深度 优先 搜索 的 递归 实现 。 算 法 开始 时 ， 你 
仅 需 把 开始 节点 压 人 栈 中 。 然 后 ， 重 复 下 列 操作 直到 栈 为 空 : 

1. 弹出 栈 顶 元 素 。 
2. 访问 节点 。 
3. 把 邻接 节点 压 人 栈 。 

. 把 你 上 一 题 中 的 栈 改 成 用 队列 表示 。 描 述 结果 代码 实现 的 遍历 顺序 。 

.本 章 给 出 的 depthFirstSearch fllbreadthFirstSearch 遍历 函数 是 用 来 强调 隐 含 的 算法 结 
构 。 如 果 你 想 要 赛 括 这 些 图 的 遍历 策略 ， 必 须 重 新 实现 函数 使 其 不 再 依赖 于 用 户 自 定 义 的 visit 
函数 。 一 种 方法 是 通过 给 graph .h 加 入 下 列 类 方法 以 实现 上 述 两 种 算法 : 
void mapDFS (void (*fn) (NodeType *), NodeType *start); 
void mapBFS (void (*fn) (NodeType *), NodeType *start); 

在 上 述 任 一 种 遍历 顺序 中 ,方法 要 为 每 个 可 达 节 点 从 start 指针 调用 £n (node) 。 

6. 本 章 给 出 的 广度 优先 搜索 的 实现 算法 得 到 了 正确 的 遍历 ， 但 在 队列 中 产生 了 元 余 的 遍历 路 径 。 问 题 
EF: 即使 终 节点 已 经 被 访问 ， 代 码 依然 将 新 路 径 加 到 队列 中 ， 这 意味 着 一 旦 这 条 路 径 从 队列 中 移 
除 ， 它 将 很 容易 被 忽略 。 你 可 以 在 加 入 队列 之 前 通过 检测 终 节 点 是 否 被 访问 来 修复 这 个 问题 。 

编写 一 个 检测 程序 来 评估 使 用 和 没有 使 用 这 个 检测 对 于 函数 实现 的 相对 效率 。 你 的 检测 程序 应 
该 能 够 在 数 个 大 图 中 读 取 ， 这 些 大 图 的 平均 度数 不 同 ， 并 且 这 些 算法 都 可 在 任 一 个 图 中 的 随机 一 个 
节点 开始 运行 。 你 的 检测 程序 还 要 能 够 在 算法 执行 中 记录 平均 队列 长 度 ， 以 及 访问 其 每 一 个 节点 所 
需要 的 总 的 运行 时 间 。 

7. 编写 一 个 函数 : 


bool pathExists (Node *nl, Node *n2); 


如 果 图 中 的 节点 n1 和 n2 中 有 路 径 ， 则 返回 true。 实 现 采 用 深度 优先 搜索 从 nl 节点 开始 遍历 图 
的 函数 ; 如 果 途 中 遇 到 n2 ， 则 路 径 存 在 。 采 用 广度 优先 搜索 算法 重新 实现 该 函数 。 在 大 图 中 ， 哪 种 
实现 方式 可 能 更 高 效 ? 

8. 编写 一 个 函数 : 


int hopCount(Node *n1, Node *n2); 


函数 返回 节点 nl 和 n2 ZARA AM BERK. WR nl n2 44, hopCount 返回 值 为 0 ; 
如 果 不 存在 路 径 ，hopCcount 返回 值 为 -1。 这 个 函数 易于 用 广度 优先 搜索 实现 。 
9. 通过 编写 文件 graphpriv.h 和 graphimpl .cpp， 完 成 图 18-7 中 的 Graph 类 的 实现 。 
10. 定义 并 实现 graphio.h 接口 ， 使 之 输出 习题 1 和 习题 2 中 的 readGraph 和 writeGraph 方 
法 ， 通 过 修改 Graph 类 模板 版 本 完成 。 
11. 尽管 本 章 包 含 了 Dijkstra 算法 的 实现 ， 然 而 ,缺乏 环境 基础 使 该 算法 能 得 以 应 用 。 编 写 C++ 程序 
来 创建 一 个 有 实际 应 用 的 Dijkstra 算法 ， 它 执行 以 下 操作 : 
© 从 图 中 读 取 文件 。 
e 人 允许 用 户 输入 两 个 城市 的 名 称 
* 用 Dijkstra 算法 找到 并 输出 最 短路 径 。 
12. 数 个 重要 的 图 算法 可 作用 于 一 类 特殊 的 图 中 ， 图 中 的 节点 可 以 这 种 方式 被 划分 为 两 个 集合 ， 使 得 所 
有 的 弧 和 不 同 集合 中 的 节点 相连 ， 同 一 集合 中 没有 节点 相连 。 这 种 图 被 称 为 二 部 图 ( bipartite)。 编 
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写 一 个 函数 模板 : 


template <NodeType ,ArcType> 
bool isBipartite (Graph<NodeType,ArcType> & g); 


函数 读 取 任意 一 个 图 ， 如 果 具 有 二 部 图 性 质 ， 则 返回 true。 
.尽管 Dijkstra 算法 对 于 寻找 最 小 代价 路 径 具 有 极 大 实际 意义 ,但 还 有 其 他 一 些 图 算法 也 具有 相当 大 的 
商业 价值 。 在 很 多 情况 下 ， 寻 找 特定 两 个 节点 间 的 最 小 代价 路 径 并 不 如 最 小 化 整个 网 络 的 代价 更 重要 。 

例如 ， 假设 你 在 一 家 新 建 的 电缆 系统 的 公司 里 工作 ， 它 连接 着 10 个 大 城市 。 初 步 研究 为 你 提 
供 了 沿 着 不 同 的 可 能 路 径 架 设 新 电缆 系统 的 预算 。 这 些 路 径 及 其 成 本 如 图 18-16 中 的 左 图 所 示 。 你 
的 任务 是 找到 最 经 济 的 架设 新 电缆 系统 的 方案 ， 使 得 所 有 城市 都 能 够 通过 路 径 相连 。 

为 了 节约 成 本 ， 要 避免 把 架设 的 电缆 在 图 中 构成 一 个 循环 。 这 样 的 电缆 是 不 必要 的 ， 因 为 城 
市 已 经 可 以 通过 其 他 的 路 径 相 连 。 如 果 你 的 目标 是 找 出 图 中 节点 之 间 的 最 小 代价 路 径 的 一 组 弧 ， 
你 可 能 会 遗漏 这 样 的 弧 。 剩 下 的 没有 循环 的 图 形成 了 树 。 一 个 连接 图 中 所 有 节点 的 树 被 称 为 生成 
树 (spaning tree)。 生 成 树 相 连 弧 的 总 路 径 最 短 的 树 称 为 最 小 生成 树 (minimun spaning tree)。 上 一 
题 提 及 的 电缆 网 络 问题 因此 等 同 于 找 出 图 的 最 小 生成 树 ， 最 小 生成 树 在 图 18-16 中 的 右边 。 

文献 中 已 有 许多 寻找 最 小 生成 树 的 算法 。 其 中 最 简单 的 一 个 方法 是 由 约瑟夫 ' 克 鲁 斯 卡 
(Joseph Kruskal) 于 1956 年 设计 的 。 在 Kruskal 算法 中 ， 你 要 把 图 中 的 弧 按 照 递增 次 序 进行 排序 。 
如 果 节 点 末端 的 弧 是 未 连接 的 ， 这 部 分 弧 就 成 为 生成 树 的 一 部 分 。 然 而 ， 如 果 这 些 节点 已 经 通过 
路 径 相 连 ， 则 可 以 完全 和 忽略 弧 。 构 建 图 18-16 中 的 最 小 生成 树 的 步骤 在 下 列 示 例 中 展示 : 


San Francisco 








: Palo Alto - San Francisco (not needed) 
19: San Francisco — San Rafael 

21: Fremont - Palo Alto (not needed) 
22: Berkeley - Vallejo 

28: San Rafael — Vallejo (not needed) 
30: Berkeley - San Rafael (not needed) 
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Graph<Node ,Arc> 


findMinimumSpanningTree (Graph<Node,Arc> & g); 


实现 Kruskal 算法 ， 找 出 最 小 生成 树 。 函 数 要 返回 一 个 新 图 ， 它 的 节点 按照 原 图 相连 ,但 仅 包含 最 
小 生成 树 部 分 的 弧 。 


.图 的 支配 集 (dominating set) 是 由 节点 与 其 相 邻 节点 组 成 全 图 节点 的 集合 的 子 集 。 也 就 是 说 ， 图 中 


所 有 的 节点 都 是 在 控制 集中 ， 或 是 支配 集中 的 节点 的 邻 节点 。 在 下 面 的 图 中 ， 每 一 个 节点 都 标注 
了 它们 的 邻 节点 数量 ， 以 便于 追踪 算法 一 一 有 内 容 的 节点 组 成 图 的 支配 集 。 其 他 的 支配 集 也 可 以 。 


3 
3 
Q 





理想 状态 下 ， 你 很 可 能 找到 尽量 小 的 支配 集 。 但 是 ， 众 所 周知 ， 这 是 一 个 计算 难度 极 大 的 任 
务 一 一 对 大 多 数 图 来 说 计算 成 本 太 高 。 下 列 算法 即使 不 能 总 是 输出 最 理想 的 结果 ， 通 常 也 能 够 找 
到 相对 小 的 支配 集 : 
1) AUER SFHR 
2.) 将 图 中 的 节点 按照 度数 递减 顺序 排序 。 换 句 话说 ， 你 想 要 从 相 邻 节点 最 多 的 节点 开始 ， 然 后 按 
照相 邻 节点 递减 的 次 序 遍 历 。 如 果 两 个 或 更 多 的 节点 具有 相同 的 度数 ， 你 可 以 按 任意 次 序 遍 历 。 
3) 如 果 你 在 第 2 步 选 的 节点 不 是 宛 余 节点 ， 将 其 并 人 8$。 当 一 个 节点 自身 以 及 它 的 所 有 相 邻 节点 
已 经 在 3 里 了 ， 则 称 该 节点 是 元 余 节 点 。 
4) 继续 操作 直到 S 支配 整个 图 。 
编写 一 个 函数 模板 : 
template «NodeType,ArcType» 


Set«NodeType *> 
findDominatingSet(Graph«NodeType,ArcType» & g); 


用 这 个 算法 找到 图 g 的 小 支配 集 。 


.图 算法 经 常 适合 于 分 布 式 地 处 理 ， 其 中 ， 对 图 中 的 每 个 节点 进行 处 理 。 尤 其 是 这 种 算法 通常 用 来 寻 


找 计算 机 网 络 中 最 优 传输 路 线 。 举 例 说 明 ， 下 面 的 图 展示 了 ARPANET 中 的 前 10 个 节点 ， 网 络 由 
美国 国防 部 ， 即 今天 复杂 的 因特网 的 先驱 ARPA 创建 : 





ARPANET 早期 的 节点 由 被 称 为 接口 通信 处 理 机 ( interface message processor, IMP) 的 小 型 


822 


550 £18* 


计算 机 组 成 。 作 为 网 络 操作 的 一 部 分 ， 每 个 IMP 都 会 给 它 的 相 邻 节点 发 信息 ， 用 来 指出 从 那个 节 
点 到 其 他 任意 节点 的 跳跃 次 数 ， 以 及 IMP 拥有 那个 信息 的 程度 。 通 过 监控 信息 的 传人 ， 每 个 IMP 
会 迅速 从 整个 网 络 找 出 有 效 的 路 径 信息 。 

为 了 使 想法 更 加 具体 ， 设 想 一 下 每 个 IMP 维持 一 个 数组 ， 这 个 数组 的 每 个 索引 位 置 对 应 着 一 
个 节点 。 当 整个 网 络 运行 时 ，Stanford IMP (STAN) 中 的 数组 包含 以 下 内 容 : 





BBN CMU HARV MT NAL RAND SAI STAN UCLA UTAH 
然而 有 趣 的 问题 是 ， 数 组 包含 的 内 容 并 不 太 重 要 ， 更 重要 的 是 网 络 如 何 运行 和 维护 。 当 一 个 
节点 重启 时 ， 它 根本 不 懂得 完整 的 网 络 是 什么 。 实 际 上 ，Stanford 节点 所 能 自己 决定 的 仅 有 信息 是 
它 的 人 口 为 0 跳跃 。 因 此， 在 启动 时 ，STaAN 节点 中 的 数组 看 起 来 如 下 所 示 : 


BBN CMU HARV SRI STAN UCLA UTAH 


路 由 算法 通过 让 每 个 节点 沿 着 自己 的 相 邻 节点 向 前 推进 。 举 个 例子 ，Stanford IMP 把 其 数组 传 
送 至 SRI 和 UCLA。 它 也 从 相 邻 节点 收 到 类 似 的 信息 。 如 果 在 UCLA 的 IMP 刚刚 启动 ， 它 可 能 传 
送 包含 以 下 数组 的 信息 : 





BBN  CMU HARV MIT NRL RAND SRI STAN UCLA UTAH 


这 条 信息 为 Stanford 节 点 提供 了 一 些 有 趣 的 信息 。 如 果 它 的 相 邻 节点 能 够 以 0 跳跃 到 达 
UCLA, ABA Stanford 节点 就 能 在 | 以 内 到 达 。 结 果 ，Stanford 节点 会 校正 其 路 径 数组 ， 如 下 所 示 : 


BBN CMU HARV STAN UCLA UTAH 


ee m 
要 检查 每 一 个 即将 到 来 的 数组 的 已 知人 口 ， 用 已 知 值 加 一 代替 对 应 的 自己 的 数组 。 在 非常 短 的 时 
间 内 ， 贯 穿 整个 网 络 的 路 径 数 组 会 得 到 正确 的 信息 。 

编写 一 个 程序 ， 用 图 来 模拟 这 个 网 络 中 节点 的 路 由 算法 的 计算 过 程 。 


| 第 19 章 


Programming Abstractions in C++ 


Ak 承 


请 当心 不 要 玩弄 你 宝贵 的 遗产 。 
一 一 享 利 ， 卡 伯 特 : 洛 奇 ，“ 国 家 联盟 ”，1919 


通过 第 4 章 对 流 类 层次 结构 的 介绍 ， 你 已 经 知道 了 类 似 C++ 和 Java 这 样 的 面向 对 象 语 
言 的 一 个 特性 : 允许 你 在 类 之 间 定 义 继承 关系 。 如 果 你 的 类 提供 了 某 些 你 所 需要 且 可 以 应 用 
于 其 他 特定 场合 的 功能 ,那么 你 可 以 考虑 定义 一 个 从 该 类 派生 的 新 子 类 ， 该 子 类 以 某 种 形式 
特 化 了 父 类 的 行为 。 每 一 个 子 类 继承 了 其 父 类 的 行为 ， 而 这 些 父 类 的 行为 也 是 从 它们 自身 的 
父 类 继承 而 来 。 虽 然 你 已 经 在 流 类 库 中 接触 过 继承 ， 但 是 并 没有 将 这 一 特性 应 用 于 你 自己 定 
义 的 类 。 本 章 我 们 将 引导 你 定义 类 层次 ， 让 继承 在 这 些 类 的 联系 中 扮演 重要 作用 。 

同时 ， 你 必须 认识 到 : 在 C++ 语言 中 使 用 继承 特性 比 在 其 他 语言 中 更 容易 产生 问题 。 
特别 是 在 你 已 经 具备 Java 语言 编程 经 验 的 情况 下 ， 你 将 受 先前 学 习 的 继承 概念 影响 ， 但 实 
际 上 这 些 概念 并 不 完全 适合 于 C++ 语言。 因此 学 习 C++ 语言 中 对 继承 特性 使 用 的 约束 与 学 
习 使 用 该 特性 所 带 来 的 优势 同样 重要 。 


19.1 简单 的 继承 


在 考虑 复杂 的 继承 应 用 之 前 ， 我 们 先 通过 几 个 简单 的 例子 来 了 解 继承 特性 。 为 了 了 解 继 
承 的 最 基本 形式 ， 先 来 看 C++ 语言 中 对 于 子 类 的 定义 : 


class subclass : public superclass { 
new entries for the subclass 
i 
在 上 述 定 义 模 式 中 ， 子 类 subclass 继承 了 父 类 superclass 中 所 有 的 公有 成 员 。 父 类 中 的 私有 
部 分 仍 保持 了 其 私有 特性 。 因 此 ， 子 类 不 能 直接 访问 父 类 中 的 私有 方法 和 私有 实例 变量 。 


19.1.1 指定 模板 类 中 的 类 型 


在 C++ 语言 中 ， 我 们 可 以 创建 一 个 除了 类 头 之 外 不 包含 任何 其 他 代码 的 实用 子 类 ， 尤 
其 在 父 类 是 一 个 模板 类 的 情况 下 。 例 如 ， 你 可 以 像 下 面 的 代码 一 样 定 义 一 个 StringMap 类 
来 映射 字符 串 对 : 


class StringMap : public Map<string,string> { }; 


使 用 简单 的 类 名 StringMap 可 以 让 程序 变 得 更 加 短小 和 易 读 ， 因 为 在 使 用 类 名 的 时 候 不 需 
要 写 出 模板 参数 。 

指定 模板 参数 类 型 的 优势 在 涉及 复杂 类 型 时 将 变 得 更 加 明显 。 特 别 是 当 应 用 程序 已 经 定 
义 了 自己 的 city 类 和 Flight 类 时 ， 你 可 能 想 定 义 一 个 新 的 Graph 子 类 来 表示 第 18 章 中 
的 飞机 航线 图 。 下 面 的 定义 创建 了 一 个 新 的 AirlineGraph 类 , 该 类 将 节点 和 弧 的 类 型 分 
IJEN City M Flight: 
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class AirlineGraph : public Graph<City,Flight> { }; 


19.1.2 EX Employee 类 


假设 你 的 当前 任务 是 为 公司 设计 一 个 面向 对 象 的 工资 结算 系统 。 在 起 始 阶 段 ， 你 可 能 需 
要 设计 一 个 名 为 Employee 的 类 ， 该 类 封装 了 一 名 雇员 的 信息 和 工资 结算 系统 运行 所 需 的 
部 分 方法 。 这 些 操作 可 能 包括 类 似 getName 这 样 的 用 来 返回 员工 姓名 的 简单 方法 ， 还 有 类 
似 getPay 这 样 根据 每 一 个 Employee 对 象 中 存储 的 数据 来 计算 员工 工资 的 复杂 方法 。 然 
而 ， 在 许多 公司 中 ， 员 工 可 能 被 分 为 不 同 的 类 别 ， 它 们 在 某 些 方面 是 类 似 的 ， 但 却 各 不 相 
同 。 例 如 ， 一 个 公司 可 能 有 钟点 工 、 计 件 工 和 薪水 工 ， 它 们 可 能 会 使 用 同一 个 工资 结算 系 
统 。 在 这 样 的 公司 里 ， 像 图 19-1 中 UML 图 所 示 的 为 每 种 类 别 的 员工 定义 一 个 子 类 将 会 非常 
有 用 。 













HourlyEmployee CommissionedEmployee SalariedEmployee 


getPay() getPay () getPay () 
setHourlyRate (wage) setBaseSalary (dollars) setSalary (salary) 
setHoursWorked (hours) setCommissionRate (rate) 

setSalesVolume (dollars) 


图 19-1 一 个 简单 的 Employee 类 层次 


该 继承 层次 的 根 是 Employee 类 ， 该 类 定义 了 所 有 员工 的 通用 方法 。Employee 类 提 
供 了 类 似 getName 这 样 的 方法 ， 它 被 其 他 类 简单 地 继承 。 毕 竟 ， 所 有 的 员工 都 有 自己 的 名 
字 。 男 一 方面 ， 为 每 一 个 子 类 编写 自己 的 getPay 方法 是 非常 重要 的 ， 因 为 每 一 类 员工 的 
工资 结算 方法 不 同 。 小 时 工 的 最 后 工资 取决 于 每 小 时 的 工资 数 和 员工 工作 的 总 时 间 。 计 件 工 
的 最 后 工资 取决 于 底薪 加 上 员工 负责 的 委托 销售 额 的 佣金 。 同 时 ， 必 须 很 清楚 地 意识 到 ， 即 
每 个 子 类 的 getPay 方 法 实现 各 不 相同 ， 每 一 类 员工 也 都 有 自己 的 getPay 方 法 。 所 以 我 
们 必须 在 Employee 类 中 定义 这 个 方法 ， 并 在 子 类 中 重 置 (override) 该 方法 定义 。 

如 果 你 仔细 观察 图 19-1 的 版 式 ， 会 发 现 Employee 类 和 该 类 的 getPay 方 法 都 以 
斜体 书写 。 在 UML 图 中 ， 斜 体 字 用 来 说 明 一 个 类 或 者 一 个 方法 是 抽象 的 (abstract)， 这 
表明 在 该 继承 层次 中 仅 提供 了 那些 将 出 现 子 类 中 的 方法 的 规格 说 明 。 例 如 ， 我们 知道 
不 存在 基本 的 Employee 类 型 的 对 象 。 每 一 个 Employee 类 型 的 对 象 必 须 属 于 其 子 类 
HourlyEmployee, CommissionedEmployee, 或 者 SalariedEmployee。 每 个 子 类 
对 象 仍然 是 Employee 类 型 ， 因 此 这 些 对 象 在 继承 了 getName 方法 的 同时 也 继承 了 虚 方 法 
getPay 的 原型 。 

19-2 向 我 们 展示 了 基于 Employee 类 层次 的 一 组 类 的 定义 框架 。 正 如 你 在 本 书 中 看 
到 的 C++ RHO, Employee 类 与 其 子 类 的 实现 细节 被 组 织 在 .cpp 文件 中 。 即 使 考虑 到 
了 上 述 事 实 ， 由 于 它们 缺少 类 的 私有 部 分 的 内 容 ， 同 时 缺少 构造 该 类 对 象 的 构造 函数 和 类 接 
口 所 必需 的 相关 注释 ， 因 此 图 19-2 中 的 类 定义 依旧 显得 过 于 残缺 而 不 利于 实际 应 用 。 当 然 ， 
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该 图 的 作用 只 是 向 我 们 说 明 C++ 语言 中 对 子 类 的 应 用 ， 为 此 目标 ， 该 示例 肯定 已 经 足够 了 。 

构成 整个 继承 层次 的 根 Employee 类 的 定义 ， 与 之 前 其 他 类 定义 的 结构 是 相似 的 。 
Employee 类 的 公有 部 分 声明 了 两 个 方法 : 一 个 是 返回 string 类 型 的 getName 方法 ; 5 
一 个 是 返回 double 类 型 的 getPay 方法 。getName 方法 的 原型 根据 你 的 期 望 定义 。 但 是 
抽象 方法 getPay 的 原型 声明 却 略 有 不 同 : 


virtual double getPay() = 0; 


这 一 声明 引入 了 C++ 语言 的 两 个 新 特性 。 该 声明 与 以 往 相 比 ， 第 一 个 不 同 点 是 该 方法 
原型 由 关键 字 virtual 开头 ， 这 一 关键 字 向 编译 器 表明 该 方法 的 实际 代码 由 其 可 构建 对 象 
的 子 类 提供 。 第 二 个 不 同 点 是 原型 以 =0 结尾 。C++ 语言 使 用 这 一 语法 来 标记 这 一 方法 为 纯 
虚 方法 ( pure virtual method)， 它 在 基 类 中 没有 定义 ， 因 此 ， 其 实现 只 能 由 其 子 类 提供 。 然 
而 ， 并 不 是 所 有 的 虚 方 法 都 是 纯 虚 方法 。 在 许多 继承 层次 中 ， 父 类 提供 了 某 一 方法 的 一 种 默 
认定 义 ， 而 这 些 父 类 的 子 类 在 需要 改变 这 些 方法 的 定义 时 可 以 重 置 这 些 方法 的 定义 。 


k 
* 


* 


Class: Employee 


* 


This class defines the root of the Employee hierarchy. Employee is 

an abstract class, which means that there are no objects whose primary 
type is Employee. Every object is constructed as one of the subclasses. 
The getPay method is declared using the virtual keyword, which means 
that it can be overridden by its subclasses. The "- 0" notation at the 
end of the prototype marks getPay as a "pure virtual" method, which 

is implemented only in the subclasses. 

/ 


class Employee { 
public: 
std::string getName(); 
virtual double getPay() = 0; 
N 


* + + + o +++ 


/[* 
* 


Subclasses: HourlyEmployee, CommissionedEmployee, SalariedEmployee 
* 

* These classes represent the concrete manifestations of the abstract 
* Employee class. Each subclass inherits the getName method from 

* Employee, but defines its own version of the getPay method. 

+f 


class HourlyEmployee : public Employee { 
public: 

virtual double getPay(); 

void setHourlyRate (double rate); 

void setHoursWorked (double hours); 
N 


class CommissionedEmployee : public Employee ( 
public: 

virtual double getPay(); 

void setBaseSalary (double dollars); 

void setCommissionRate (double rate); 

void setSalesVolume (double dollars); 
) 
class SalariedEmployee : public Employee { 
public: 

virtual double getPay(); 


void setSalary(double salary); 
E 





图 19-2. Employee 类 层次 的 简化 定义 
如 果 你 习惯 了 其 他 语言 的 继承 机 制 ， 会 觉得 使 用 关键 字 virtual 标记 一 个 方法 没有 必 
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要 。 在 大 多 数 支持 继承 的 语言 中 ,所 有 的 虚 方法 都 需 标识 ， 只 不 过 C++ 语言 用 virtual 这 
一 术语 标记 虚 方法 而 已 。 如 果子 类 重 置 了 其 父 类 的 一 个 方法 ,程序 员 总 是 习惯 于 传统 的 继 
承 模式 ， 期 竺 在 子 类 中 该 方法 的 新 定义 会 被 应 用 到 该 类 型 的 对 象 中 。 但 是 这 一 规则 在 C++ 
语言 中 不 会 被 自动 遵循 。 如 果 你 缺少 了 virtual 关键 字 ， 编 译 器 将 会 根据 对 象 的 声明 类 型 
来 判断 调用 哪 一 个 版 本 的 方法 ， 而 不 是 根据 对 象 实际 构造 的 类 型 来 判断 。 例 如 ， 即 使 你 在 
SalariedEmployee 子 类 中 重 置 了 getName 方法 ， 在 使 用 一 个 声明 为 Employee 类 型 
的 对 象 来 调用 getName 方法 时 ,依旧 会 调用 Employee 类 中 定义 的 原始 版 本 getName 方 
法 。 新 版 本 的 getName 方法 仅 用 于 显 式 声 明 它 是 SalariedEmployee 类 的 一 个 方法 。 

继承 自 Employee 类 的 三 个 子 类 定义 的 结构 相同 。 子 类 的 头 部 通过 在 其 类 名 之 后 增加 
一 个 冒号 、 关 键 字 public 和 父 类 名 来 表明 其 继承 关系 。 因 此 HourlyEmployee 类 的 定 
义 头 部 如 下 所 示 : 

class HourlyEmployee : public Employee 
HourlyEmployee 类 将 自动 继承 其 父 类 Employee 类 的 公有 方法 ， 因 此 该 类 包含 了 一 个 
父 类 中 定义 的 getName 方法 。 然 而 ，getPay 方法 的 定义 必须 在 子 类 中 实现 ， 因 为 该 方法 
ft Employee 类 中 被 定义 成 纯 虚 方法 。 每 一 个 子 类 定义 必须 包括 以 下 虚 方 法 原型 ， 向 编译 
器 告知 该 类 重 置 了 getPay 方法 : 


virtual double getPay(); 


getPay 方 法 的 实现 在 .cpp 文件 中 ， 并 使 用 子 类 名 来 标记 其 所 属 类 。 因 此 ,Hourly 
Employee 类 中 的 getPay 方法 实现 如 下 ， 这 里 我 们 假设 类 中 包含 私有 实例 变量 hours 
Worked 和 hourlyRate: 

double HourlyEmployee::getPay() ( 


return hoursWorked * hourlyRate; 


} 


19.1.3 C++ 中 子 类 的 局 限 性 


面向 对 象 程序 设计 的 一 个 基本 原则 就 是 子 类 对 象 是 它们 所 属 父 类 的 一 个 实例 。 因 此 ,在 
前 面 介 绍 的 Employee 类 继承 层次 中 ，HourlyEmployee 对 象 也 是 更 泛 化 的 Employee 
类 的 实例 。 然 而 ， 这 一 事实 可 能 会 由 于 你 接触 过 类 似 Java 语言 这 类 与 C++ 语言 机 制 大 不 相 
同 的 编程 语言 ， 而 误导 你 在 操作 继承 的 数据 结构 实例 时 做 出 错误 的 假设 。 

C++ 语言 继承 机 制 中 最 容易 让 编程 人 员 产 生 混 乱 的 是 赋值 操作 的 实现 。 例 如 ， 由 于 每 
一 个 HourlyEmployee 对 象 仍然 是 一 个 Employee WH, RE Java 语言 中 一 样 ， 将 一 个 
HourlyEmployee 类 型 的 对 象 赋值 给 一 个 Employee 类 型 对 象 是 合乎 逻辑 的 ， 如 以 下 代 
码 所 示 : 


HourlyEmployee bobCratchit; 
Employee clerk; 
clerk - bobCratchit; 
上 述 程 序 的 第 一 行将 bobcratchit 声 明 为 HourlyEmployee 类 型 的 对 象 ; 第 二 行将 


clerk 声明 为 Employee 类 型 。 但 是 错误 发 生 在 第 三 行 ， 程 序 试图 使 用 bobcratchit H 
行 赋值 。 虽 然 这 一 段 代码 在 C++ 语言 中 是 完全 合法 的 ， 但 是 会 弹出 一 段 警告 ， 告 诉 你 代码 


E 了 项 555 


很 可 能 不 会 以 你 所 期 望 的 模式 运行 。 

在 C++ 语言 中 ， 即 使 局 部 变量 是 某 个 类 的 实例 ， 也 总 是 被 分 配 在 栈 中 。 为 了 创建 一 个 
栈 帧 结构 ， 编 译 器 必须 提前 知道 每 一 个 局 部 变量 所 需 分 配 的 空间 。 在 这 个 例子 中 ， 编 译 器 为 
bobCratchit 变量 分 配 了 足够 的 空间 来 存储 一 个 HourlyEmployee 类 型 的 对 象 ， 也 给 
clerk 变量 分 配 了 足够 的 空间 来 存储 Employee 类 型 的 对 象 。 其 中 ,HourlyEmployee 
EY JET Employee 类 ， 这 意味 着 该 类 中 继承 了 父 类 已 定义 的 实例 变量 。 每 一 个 子 类 最 少 
需要 与 其 父 类 同等 大 小 的 存储 空间 ， 并 且 通 常 所 需要 的 空间 会 更 大 。 因 此 ， 存 储 这 两 个 变量 
的 栈 帧 结构 图 如 下 图 所 示 : 


bobCratchit 


clerk 


C++ 语言 在 没有 对 赋值 操作 进行 重 载 定义 情况 下 ， 将 一 个 对 象 赋值 给 另 一 个 对 象 是 通过 
将 源 对 象 的 所 有 变量 域 复制 到 目的 对 象 相 应 的 变量 域 来 实现 的 。 因 此 ， 以 下 赋值 语句 : 


clerk = bobCratchit; 


将 试图 拷贝 bobcratchit 中 的 数据 到 clerk 中 的 空间 ， 这 就 像 试 图 将 一 NOSTRAM 
一 个 较 小 的 孔 中 。 
在 这 种 情况 下 ，C++ 语言 只 会 拷贝 对 象 间 重合 部 分 的 变量 域 中 的 内 容 ， 在 这 个 例子 中 就 
是 HourlyEmployee 类 从 Employee 继承 的 部 分 。 因 此 对 象 赋值 操作 后 的 数据 转换 如 下 
图 所 示 : 





图 中 HourlyEmployee 类 的 灰色 部 分 变量 域 的 内 容 将 被 丢弃 。 这 种 赋值 时 只 拷贝 对 象 一 部 
分 的 行为 被 称 为 切片 (slicing)。 
禁止 将 一 个 子 类 实例 拷贝 到 其 父 类 所 创建 的 存储 空间 会 同时 导致 其 他 问题 。 例 如 ， 
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你 可 能 想 要 将 雇员 列表 存储 在 一 个 矢量 中 。 不 幸 的 是 ， 如 果 你 采用 以 下 声明 ， 将 不 能 达到 
目的 : 


Vector<Employee> payroll; M 


如 同上 述 赋值 例子 ，payrool 矢量 的 元 素 只 能 储存 Employee 类 的 实例 。 如 果 你 试图 执行 
以 下 语句 : 


payroll.add(bobCratchit) ; X 


add 方法 的 实现 将 切除 bobcratchit 中 所 有 不 是 Employee 继承 来 的 数据 。 
C++ 语言 中 解决 该 问题 的 传统 方法 就 是 使 用 指针 来 操作 对 象 而 不 是 使 用 对 象 本 身 。 例 
如 ， 最 好 使 用 如 下 方法 声明 payroll 矢量 : 


Vector«Employee *> payroll; 


所 有 指向 Employee 对 象 的 指针 都 占有 相同 的 存储 空间 ， 因 此 ， 这 一 指针 适用 于 矢量 中 的 
所 有 Employee 类 型 对 象 。 除 此 之 外 ， 如 果 你 采用 payroll 中 的 指针 调用 Employee 类 
中 的 虚 方 法 ，C++ 将 会 调用 与 子 类 中 的 对 应 方法 相 绑 定 。 因 此 ， 如 果 你 执行 以 下 代码 : 

for (Employee *ep : payroll) { 


cout << ep->getName() << ": " << ep->getPay() << endl; 
} 


将 会 得 到 payroll 矢量 中 的 所 有 雇员 列表 ， 同 时 还 有 每 个 雇员 应 得 的 报酬 。 对 getPay X 
法 的 调用 将 为 其 选择 适合 实际 Employee 子 类 方法 的 版 本 。 

可 惜 ， 使 用 指针 使 内 存 管 理 的 过 程 变 得 复杂 ， 这 是 C++ 语言 编程 所 面临 的 重大 挑战 。 
每 个 类 都 定义 了 一 个 析 构 函数 用 以 释放 为 该 类 对 象 所 分 配 的 内 存 空间 ， 因 此 ， 我 们 可 以 让 内 
存 管理 置 于 我 们 的 控制 之 下 。 但 是 当 你 的 指针 越界 时 ， 就 不 能 保证 析 构 函数 会 在 合适 的 时 间 
被 调用 ， 此 时 类 的 整体 复杂 度 迅 速 增 大 。 

当 你 用 C++ 语言 设计 一 个 类 时 ， 最 重要 的 就 是 要 保持 这 一 平衡 。 在 大 多 数 情况 下 ， 最 
好 的 方法 是 避免 使 用 继承 并 创建 独立 的 类 来 管理 自身 的 堆 内 存 。 但 是 ， 如 果 你 认为 需要 使 用 
继承 机 制 ， 将 面临 一 个 困难 的 选择 。 一 种 方法 是 定义 私有 的 拷贝 构造 函数 和 重 载 赋值 操作 符 
函数 ， 使 得 拷贝 对 象 在 该 继承 层次 中 是 被 禁止 的 。 虽然 这 一 做 法 消除 了 切片 导致 数据 丢失 的 
可 能 ,但 是 禁止 拷贝 使 得 将 对 象 嵌 入 到 大 型 数据 结构 变 得 困难 。 但 是 ， 如 果 你 不 禁用 赋值 ， 
用 户 就 必须 承担 内 存 管 理 的 职责 。 从 不 管理 到 完全 管理 ， 这 种 情况 会 给 用 户 带 来 可 怕 的 工 
作 量 。 

C++ 语言 的 类 库 设 计 者 根据 不 同 的 情况 做 出 了 不 同 的 选择 。 集 合 类 实现 为 独立 的 类 ， 
并 不 包含 继承 关系 。 相 反 ， 流 类 构成 了 一 个 复杂 的 继承 层次 但 不 允许 用 户 进行 赋值 。 设 计 
者 对 每 一 种 情况 都 选择 了 向 用 户 隐 藏 内 存 管理 的 细节 。 当 你 设计 自己 的 类 时 ， 这 人 么 做 是 明 
智 的 。 


19.2 图 形 对象 的 继承 层次 
本 书 的 图 形 接口 设计 例子 中 ,我 们 发 现 对 继承 层次 的 应 用 所 带 来 的 好 处 使 得 复杂 性 增加 
这 一 弊端 可 以 被 忽略 。 图 形 用 户 接口 在 当今 的 系统 中 普遍 存在 ， 并 通常 依赖 继承 层次 来 定义 
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相关 的 应 用 程序 接口 ( application programming interface，API)， 实 现 者 使 用 这 一 接口 来 编 
写 必要 的 代码 。 在 一 个 特定 的 API 中， 继承 关系 分 为 几 个 层次 。 用 于 应 用 显示 的 窗口 、 对 
话 框 和 面板 构成 了 一 个 类 层次 。 在 这 个 类 层次 中 ， 大 和 多数 窗口 系统 允许 程序 显示 文本 、 图 像 
和 各 种 几何 形状 ， 从 而 形成 了 它们 自己 的 一 个 继承 层次 。 

Stanford 库 包 括 了 一 个 gobject.h 接口， 该 接口 允许 用 户 在 图 形 窗口 中 显示 对 象 。 本 
节 将 实现 一 个 简化 版 本 的 gobjects.h， 该 接口 提供 了 图 19-3 中 展示 的 类 ， 类 限制 在 直 
线 、 和 矩形 和 椭圆 类 上 。 








setLocation (x, v) 
move (dx, dy) 
setColor (color) 
draw(gw) 




















GOval 


GOval (x, y, width, height) 
setFilled (flag) 
draw (gw) 


GLine (x), yj, X», Y2) 
draw (gw) 


GRect (x, y, width, height) 
setFilled (flug) 
draw (gw) 


图 19-3 简化 的 Gobject 类 继承 


正如 在 图 19-3 中 所 看 到 的 那样 ，gobjects .h 中 的 类 自己 组 成 了 一 个 继承 层次 。 抽 象 
类 Gobject 是 继承 树 中 的 根 。GObject 类 中 提供 的 方法 可 以 应 用 于 所 有 图 形 对 象 。 给 定 
任何 Gobject 对 象 ， 你 可 以 设置 它 在 图 形 窗 口中 的 位 置 ， 也 可 以 定义 它 的 颜色 。Gobject 
类 还 定义 了 一 个 araw 方 法 ， 它 可 以 在 图 形 窗口 中 用 来 显示 一 个 对 象 。 在 Gobject 类 
"P, draw 被 声明 为 一 个 纯 虚 函数 ， 这 意味 着 在 这 一 类 层次 中 它 没有 被 实现 。qravw 函数 的 
实现 由 GLine、Grect 和 Goval 类 提供 。 图 19-4 展示 了 简化 版 本 gobjects.h 接口 的 
内 容 。 












/* 
This file defines a simple hierarchy of graphical objects. 


/ 


#ifndef _gobjects_h 
define _gobjects_h 


* 
* 


#include <string> 
#include "gwindow.h" 


/* 


* Class: GObject 
* 


* This class is the root of the hierarchy and encompasses all objects 
* that can be displayed in a window Clients typically use a pointer 
* to a GObject rathe: whan the GObject itself. 
ay 
class GObject { 
public: 


/* 





图 19-4 gobjects .h 接口 
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* Method: setLocation 
* Usage: gobj-»setLocation(x, y); 


* Sets the x and y coordinates of gobj to the specified values. 


*/ 
void setLocation(double x, double y); 


Method: move 
Usage: gobj-»move(dx, dy); 


Adds dx and dy to the coordinates of gobj. 
void move(double x, double y); 


Method: setColor 
Usage: gobj-»setColor (color); 


Sets the color of gobj. 


void setColor(std::string color); 


Abstract method: draw 
Usage: gobj-»draw(gw); 


Draws the graphical object on the GraphicsWindow specified by gw. 
This method is implemented by the specific GObject subclasses. 
virtual void draw(GWindow & gw) = 0; 

protected: 


/* The following methods and fields are available to the subclasses */ 


GOb ject (); /* Superclass constructor */ 
std::string color; /* The color of the object »/ 
double x, y; /* The coordinates of the object */ 


* Subclass: GLine 


* The GLine subclass represents a line segment on the window. 


rd 
class GLine : public GObject { 
public: 
Constructor: GLine 
Usage: GLine *lp - new GLine(xl, yl, x2, y2); 


Creates a line segment that extends from (x1, 


GLine(double xl, double yl, double x2, double 
/* Prototypes for the overridden virtual methods 
virtual void draw(GWindow & gw); 


private: 
double dx; /* Horizontal distance from xl to x2 
double dy; /* Vertical distance from yl to-y2 


um 


/* 
* Subclass: GRect 





图 19-4 (£x) 
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* The GRect subclass represents a rectangle. 
x/ 
class GRect : public GObject { 
public: 
/* 
Constructor: GRect 


Usage: GRect *rp - new GRect(x, y, width, height); 


Creates a rectangle of the specified size whose upper left corner is (x, y). 


v7 
GRect(double x, double y, double width, double height); 
Method: setFilled 
Usage: rp-»setFilled(flag); 


Indicates whether the rectangle is filled. 


void setFilled(bool flag); 


/* Prototypes for the overridden virtual methods */ 


virtual void draw(GWindow & gw); 
private: 


double width, height; /* Dimensions of the rectangle 
bool filled; /* True if the rectangle is filled 


The GOval subclass represents an oval defined by a bounding rectangle. 


class GOval : public GObject { 
public: 
/* 
Constructor: GOval 
Usage: GOval *op = new GOval(x, y, width, height); 


Creates an oval inscribed in the specified rectangle. = 
GOval(double x, double y, double width, double height); 
* Method: setFilled 


Usage: op-^setFilled(flag); 


Indicates whether the oval is filled. 


void setFilled(bool flag); 
/* Prototypes for the overridden virtual methods */ 
virtual void draw(GWindow & gw); 
private: 
double width, height; /* Dimensions of the bounding rectangle */ 
bool filled; /* True if the oval is filled */ 
F 
#endif 





图 19-4 ( 续 ) 
gobjects.h 接 口中 的 每 一 个 子 类 都 定义 了 一 个 构造 函数 ,该 构造 函数 的 参数 与 
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GWindow 类 的 构造 函数 参数 一 致 ， 并 且 子 类 与 父 类 将 显示 相同 的 图 形 。 例 如 ，GLine 构造 
函数 传人 直线 两 个 端点 的 坐标 值 ， 其 原型 如 下 : 


GLine(double x1, double yl, double x2, double y2); 


这 些 参 数 与 Gwindow 类 中 的 drawLine 方法 相同 。 

图 19-4 中 的 代码 引入 了 C++ 语言 一 个 重要 的 新 特性 。 在 许多 接口 层次 中 ， 让 子 类 可 以 
访问 父 类 的 实例 变量 是 很 实用 的 ， 因 为 这 样 做 可 以 简化 代码 。Gobject 类 通过 使 用 关键 字 
Protected 来 标识 这 些 实例 变量 达成 了 这 一 目标 。protected 部 分 的 各 项 对 于 其 所 有 的 
子 类 来 说 都 是 可 访问 的 ， 但 用 户 不 可 以 访问 。 

实现 Gobject 类 层次 所 需 的 代码 显示 在 图 19-5 中 。 


/* 
* File: gobjects.cpp 


* This file implements the gobjects.h interface. 
wy 


#include <string> 
finclude "gwindow.h" 
#include "gobjects.h" 
using namespace std; 
/* 


* Implementation notes: GObject class 


* The constructor for the superclass sets the default color (BLACK). 
i 


GObject::GObject() ( 
setColor ("BLACK"); 
) 


void GObject::setLocation(double x, double y) ( 
this->x = x; 
this->y = y; 

} 


void GObject::move(double dx, double dy) { 
x += dx; 
y += dy; 

} 


void GObject::setColor(string color) { 
this->color = color; 


} 


Implementation notes: GLine class 


* The constructor for the GLine class has to change the specification 
of the line from the endpoints passed to the constructor to the 
* representation that uses a starting point along with dx/dy values. 


GLine::GLine(double x1, double yl, double x2, double y2) { 
this->x = x1; 
this->y = yl; 
this->dx = x2 - xl; 
this->dy = y2 - yl; 
) 


void GLine::draw(GWindow & gw) ( 
gw.setColor (color) ; 
gw.drawLine(x, y, x + dx, y + dy); 
) 
/* 
* Implementation notes: GRect and GOval classes 
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* The constructors for these classes store their arguments in the 
* corresponding instance variables. The draw method forwards the 
* appropriate request to the GWindow class. 

*/ 


GRect::GRect(double x, double y, double width, double height) ( 
this-»x = x; 
this->y = y; 
this-»width = width; 
this->height = height; 
filled = false; 
} 


void GRect::setFilled(bool flag) { 
filled = flag; 


void GRect::draw(GWindow & gw) { 
gw.setColor (color); 
if (filled) { 
gw.fillRect (x, y, width, height); 
] eise { 
gw.drawRect(x, y, width, height); 
) 
) 


GOval::GOval(double x, double y, double width, double height) ( 
this->x = x; 
this->y = y; 
this-»width = width; 
this->height = height; 
filled = false; 
} 


void GOval::setFilled(bool flag) { 
filled = flag; 


void GOval: :draw(GWindow & gw) ( 
gw.setColor (color); 
if (filled) { 
gw.fillOval(x, y, width, height); 
} else ( 
gw.drawOval(x, y, width, height); 
) 
) 





图 19-5 (£x) 


19.2.1 调用 父 类 的 构造 函数 


构造 函数 负责 初始 化 一 个 对 象 的 数据 域 以 确保 所 创建 的 对 象 有 一 个 一 致 状态 。 为 了 维 
护 整 个 继承 层次 的 一 臻 性， 每 一 个 子 类 的 构造 函数 必须 调用 其 父 类 的 某 个 构造 函数 。 在 缺 
乏 其 他 相关 定义 的 情况 下 ， 这 一 责任 由 父 类 的 默认 构造 函数 承担 。 因 此 ， 在 初始 化 对 象 自 
身 的 数据 域 之 前 ，GLine、GRect 和 GOval 对 象 构造 函数 将 调用 父 类 Gobject 的 默认 
构造 函数 。 

将 Gobject 类 的 构造 函数 声明 为 protected 部 分 意味 着 该 类 的 子 类 可 以 访问 
GObject 的 构造 函数 ,但 是 用 户 不 可 以 这 么 做 。 采 取 这 一 机 制 可 禁止 用 户 声明 Gobject 
类 的 对 象 ， 或 者 将 Gobject 作为 任何 集合 类 的 模板 参数 。 在 19.13 这 一 节 中 ， 所 有 试图 以 
上 述 方式 使 用 Gobject 类 的 用 户 将 使 自己 陷入 到 麻烦 之 中 。 因 此 ， 若 想 避 免 麻 烦 ， 应 将 构 
i PRS HA public 部 分 。 当 然 ， 像 本 书 中 所 介绍 的 ， 现 实 中 用 户 可 以 使 用 指针 来 操作 
GObject 类 对 象 。 

然而 ， 在 某 些 情况 下 ， 调 用 带 有 参数 的 构造 函数 相 比 调 用 不 带 参 数 的 默认 构造 函 
数 更 加 有 用 。C++ 语言 允许 你 在 子 类 的 构造 函数 代码 中 增加 额外 的 定义 ， 这 一 定义 称 
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为 初始 化 列表 (initializer list)。 初 始 化 列表 放 在 构造 函数 体 开始 的 花 括 号 之 前 ， 与 
函数 的 参数 列表 处 于 同一 行 并 在 其 之 后 。 初 始 化 列表 的 元 素 应 该 符合 以 下 其 中 一 条 
标准 : 

e 在 父 类 名 后 用 括号 括 起 来 的 参数 列表 ， 参 数列 表 必 须 与 父 类 中 某 一 构造 函数 的 了 清 数 

原型 相 匹 配 。 

e 在 父 类 的 数据 域名 后 用 括号 括 起 来 的 该 数据 域 的 初始 化 值 。 

上 述 两 种 形式 都 可 以 在 专业 C++ 语言 编程 中 使 用 ,但 本 书 只 采用 第 一 种 风格 。 

说 明 初 始 化 列表 使 用 方式 最 简单 的 方法 就 是 通过 一 个 简单 的 例子 进行 实践 。 假 设 你 想 要 
增加 一 个 Goval 的 子 类 GCircle 来 扩展 GObject 继承 层次 。 按 常理 说 ， 每 一 个 圆通 过 指 
定 半 径 和 圆心 坐标 来 进行 定义 。 因 此 ， 对 用 户 来 说 ，Gcircle 类 的 构造 函数 获取 这 些 参数 
值 来 构造 圆 将 比 使 用 Gova1 类 的 长 方形 边界 构造 圆 更 加 简便 。 图 19-6 展示 了 采用 这 一 方法 
的 Gcircle 类 的 接口 内 容 。 


/* 
,* Subclass: GCircle 
* 


* The GCircle subclass represents a circle. 
x 


class GCircle : public GOval ( 
public: 
/* 

* Constructor: GCircle 


* Usage: GCircle circle(x, y, r); 
GCircle *cp = new GCircle(x, y, r); 


* Creates a circle of radius r centered at the point (x, y). 


v 


GCircle(double x, double y, double r); 





图 19-6 GCircle 类 的 接口 内 容 


GCircle 类 实现 的 唯一 难点 在 于 怎样 初始 化 自 Goval 继承 的 Gcircle 类 的 对 象 。 
GCircle 类 不 能 使 用 之 前 的 方法 调用 Goval 类 的 默认 构造 函数 ， 因 为 Goval 类 并 没有 定义 
默认 构造 函数 。GCircle 类 的 构造 函数 必须 传人 Goval 所 需 的 参数 来 调用 Goval 类 的 构造 
函数 。 幸 运 的 是 ， 这 些 参 数值 可 以 很 容易 地 通过 计算 有 关 x、y 和 的 表达 式 得 到 。 图 19-7 
展示 了 GCircle 类 的 实现 ， 这 一 实现 代码 只 需 定义 初始 化 列表 即 可 。 

/* 
* cia ON notes: GCircle 
* The GCircle class is a subclass of GOval for which the constructor 


* interprets its arguments in a different way. This constructor uses 
* an initialization list to call the GOval constructor with the 


* correct arguments. 
*/ 


GCircle: at geal aaa ect x, double y, double r) 
GOval(x - r, y-r,2*r,2*r) { 
/* Empty */ 
} 
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19.2.2 将 GObject 类 指针 存储 在 矢量 中 

定义 Gobject 类 继承 层次 的 一 个 优势 就 是 这 么 做 允许 我 们 将 图 形 对 象 都 存储 在 一 个 
集合 中 ， 当 然 存 储 的 时 候 你 必须 记 住 使 用 指向 Gobject 对 象 的 指针 而 不 是 使 用 对 象 。 图 
19-8 向 我 们 展示 了 将 一 个 Gobject 类 集合 组 织 为 一 个 矢量 ， 之 后 在 图 形 窗口 中 绘制 这 些 
对 象 ， 它 产生 了 与 第 2 章 中 GraphicsExample 程序 一 样 的 输出 结果 。 这 个 程序 在 使 用 完 
成 后 释放 了 所 分 配 的 堆 内 存 。 


File: TestDisplayList.cpp 


This program tests the GObject classes by storing pointers to several 
* graphical objects in a vector and then drawing them all at once. The 
* picture is the same as the GraphicsExample.cpp program from Chapter 2. 


wf 


#include <iostream> 
#include "gwindow.h" 
#include "gobjects.h" 
#include "vector.h" 
using namespace std; 


int main() { 
GWindow gw; 
double width = gw.getWidth () ; 
double height = gw.getHeight(); 
GRect *rp = new GRect (width / 4, height / 4, width / 2, height / 2); 
GOval *op = new GOval(width / 4, height / 4, width / 2, height / 2); 
rp-»setColor ("BLUE"); 
op-»setColor ("GRAY"); 
Vector«GObject *» displayList; 
displayList.add(new GLine(0, height / 2, width / 2, 0)); 
displayList.add(new GLine(width / 2, 0, width, height / 2)); 
displayList.add(new GLine(width, height / 2, width / 2, height)); 
displayList.add(new GLine(width / 2, height, 0, height / 2)); 
displayList .add(rp) ; 
displayList .add(op) ; 
for (GObject *sp : displayList) { 
sp->draw (gw); 
} 
for (GObject *sp : displayList) { 
delete sp; 
} 
displayList.clear(); 
return 0; 





图 19-8 ”将 图 形 对 象 存储 在 一 个 矢量 中 的 程序 


19.3 ”表达 式 的 类 层次 

应 用 类 继承 特性 的 另 一 个 场合 是 在 编程 语言 中 算术 表达 式 的 表示 上 。 在 编译 程序 时 ， 
C++ 编译 器 必须 分 析 表 达 式 来 获取 其 中 的 信息 ， 包 括 操作 符 应 该 应 用 到 哪个 操作 数 上 ， 以 
及 选择 这 些 操作 符 所 表示 的 功能 。 一 般 来 说 ， 编 译 器 会 以 树 结构 来 保存 这 些 信息 ， 在 树 结构 
中 ， 每 一 个 独立 节点 用 来 表示 不 同 表达 式 类 型 ， 这 些 节 点 属于 类 继承 的 一 部 分 。 

本 章 的 目的 在 于 通过 实现 一 个 简单 的 应 用 程序 介绍 算术 表达 式 的 表示 机 制 ， 这 一 应 用 程 
序 不 断 执行 以 下 步骤 : 
1. 读 取 用 户 输入 的 表达 式 并 将 其 存储 到 内 部 的 树 结构 中 。 
2. 检查 树 结构 并 计算 表达 式 的 值 。 
3. 在 控制 台中 输出 表达 式 的 计算 结果 。 


a x 
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这 种 迭代 过 程 称 为 读 取 - 求 值 — 输出 循环 (read-eval-print loop). iE - 求 值 = 输出 循 
环 是 解释 器 的 重要 特性 ， 在 程序 没有 被 翻译 成 机 器 语言 之 前 ， 我 们 使 用 解释 器 执行 并 计算 程 
序 中 的 重要 操作 步骤 。 虽 然 解释 一 个 程序 的 效率 低 于 编译 一 个 程序 ， 但 相 比 之 下 ， 解 释 性 语 
言 更 加 容易 编写 和 理解 。 

读 取 一 个 表达 式 并 将 其 转换 为 内 部 格式 这 一 操作 由 以 下 三 部 分 组 成 : 

1. 输入 。 输 入 部 分 将 从 用 户 端 读 取 一 行文 本 ， 这 一 操作 可 以 简单 地 通过 调用 get Line 
函数 来 实现 。 

2. 词法 分 析 。 词 法 分 析 阶 段 负责 将 输入 的 文本 行 分 解 为 独立 单元 ， 这 些 独立 单元 称 为 
记号 (tokens)， 每 一 个 记号 都 表示 一 个 单独 的 逻辑 实体 ， 例 如 一 个 整 型 常量 、 操 
作 符 ， 或 者 变量 名 。 第 6 BN TokenScanner 类 提供 了 执行 这 一 阶段 操作 的 理想 
工具 。 

3. 语 法 分 析 。 当 一 行文 本 被 分 解 为 组 成 该 行文 本 的 一 组 记号 之 后 ， 将 执行 语法 分 析 阶 
段 ， 这 一 阶段 将 检测 每 一 个 独立 记号 是 否 构成 了 一 个 合法 的 表达 式 ， 如 果 表 达 式 合 
法 ， 则 检测 这 些 表 达 式 具有 什么 结构 。 为 了 实现 这 一 目标 ， 语 法 分 析 器 必须 能 够 使 用 
输入 的 独立 记号 构成 正确 的 语法 解析 树 。 

[842] 图 19-9 列 出 了 一 个 可 以 执行 这 些 阶 段 的 简单 解释 器 主 程序 。 


/* 
* File: Interpreter.cpp 


* This program simulates the top level of an expression interpreter. The 
* program reads an expression, evaluates it, and then displays the result. 
* 


#include <iostream> 
#include <string> 
#include "error.h" 
#include "exp.h" 

#include "parser.h" 
#include "tokenscanner.h" 
using namespace std; 


int main() { 
EvaluationContext context; 
TokenScanner scanner; 
Expression *exp; 
scanner .ignoreWhitespace () ; 
scanner.scanNumbers(); 
while (true) ( 
exp - NULL; 
try ( 
string line; 
cout << "=> "; 
getline(cin, line); 
if (line -- "quit") break; 
scanner.setInput (line); 
Expression *exp = parseExp (scanner); 
int value = exp-»eval (context); 
cout «« value «« endl; 
) catch (ErrorException ex) ( 
cerr «« "Error: " << ex.getMessage() << endl; 


) 
if (exp !- NULL) delete exp; 
H 


return 0; 





图 19-9 解释 器 的 main 函数 部 分 
程序 的 运行 示例 如 下 : 
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先 计算 乘法 ,然后 计算 加 法 。 

该 实现 的 关键 在 于 Expression 类 ， 它 代表 一 个 算术 表达 式 。Expression 类 在 
exp.h 接口 文件 中 定义 。 在 你 学 习 这 一 接口 之 前 ， 可 以 尝试 通过 观察 解释 器 代码 来 推断 该 
接口 的 构成 。 从 变量 exp 的 声明 已 知 ， 代 码 使 用 指向 Expression 对 象 的 指针 来 工作 ， 而 
.不 是 直接 使 用 对 象 本 身 。 这 一 设计 也 暗示 着 所 有 需要 操作 类 似 exp 这 样 的 表达 式 变 量 的 方 
法 必须 使 用 > RET, HEH, 虽然 你 不 知道 Expression 类 中 具体 方法 实现 的 操作 ,但 
单 从 代码 中 我 们 依旧 可 以 推断 该 类 提供 了 一 个 名 为 eval 的 方法 。 当 然 ， 这 一 操作 的 目的 与 
其 名 称 应 该 是 相符 的 。 作 为 expression 包 的 用 户 ， 你 应 更 多 地 关注 怎样 使 用 表达 式 ， 而 不 是 
表达 式 是 如 何 实现 的 。 作 为 一 个 用 户 ， 你 需要 将 Expression 类 想象 成 一 个 抽象 数据 类 型 。 
底层 细节 只 有 在 你 想 要 修改 类 的 实现 时 才 需 要 去 关注 。 

在 图 19-9 中 ， 你 可 能 还 会 注意 到 eval 方法 需要 传人 一 个 名 为 context 的 参数 ， 这 
个 参数 是 类 EvaluationContext 的 对 象 。EvaluationContext RWiXi WM REF 
符号 表 (symbol table) 的 维护 ， 该 表 记 录 了 每 一 个 变量 被 赋予 的 值 。 正 如 你 所 期 望 的 那样 ， 
EvaluationContext 类 的 代码 使 用 了 一 个 Map 以 实现 变量 名 与 变量 值 之 间 的 映射 关系 。 
实际 上 ， 这 是 属于 实现 细节 方面 的 问题 。EvaluationConText 类 中 的 方法 构成 了 对 符号 
表 的 操作 ， 这 一 操作 让 我 们 能 更 好 地 理解 编程 语言 的 语法 。 


19.3.1 异常 处 理 


类 似 你 在 本 书 中 看 到 的 其 他 程序 ， 解 释 器 中 的 模块 通过 调用 error 函数 来 报告 错误 ， 
这 一 机 制 已 经 在 第 2 章 中 介绍 过 。error 函数 的 用 法 与 之 前 类 似 ， 函 数 会 输出 错误 信息 ， 
并 终止 程序 的 执行 。 如 果 解 释 器 在 你 输入 一 个 宛 长 复杂 的 表达 式 时 发 生 终 止 ， 你 会 对 此 感到 
非常 不 便 。 只 需 设 想 一 下 应 用 卡 死 导致 你 之 前 的 所 有 输入 消失 无 踪 的 情况 ， 你 就 会 明白 这 种 
感受 。 与 大 多 数 交 互 程序 一 样 ， 解 释 器 最 好 被 设计 成 可 以 反馈 给 用 户 详细 的 错误 信息 ， 并 且 
允许 用 户 对 输入 进行 修正 。 

图 19-9 中 的 解释 器 程序 是 依靠 C++ 语言 中 一 种 称 为 异常 处 理 (exception handler) 的 
特性 向 用 户 准确 而 人 性 化 地 报告 错误 信息 ， 这 一 特性 允许 编程 人 员 对 超出 程序 正常 执行 范 
围 事件 的 发 生 采 取 不 同 的 措施 。 与 Stanford 库 中 的 实现 一 样 ，error 函数 产生 信和 号 来 报 
告 某 种 错误 已 经 发 生 ， 并 通知 其 他 函数 对 该 错误 采取 对 应 的 措施 ， 即 使 该 错误 发 生 点 位 于 
实现 错误 处 理 策 略 的 函数 之 中 ， 也 不 会 影响 其 错误 处 理 过 程 。 实 现 这 一 机 制 的 唯一 要 求 是 
响应 异常 的 代码 必须 出 现在 函数 调用 链 中 错误 出 现 的 位 置 之 前 。 标 记 异 常情 况 的 代码 被 称 为 
抛 出 异常 (throw an exception)。 为 了 与 这 一 名 称 相 匹配 ， 处 理 异 常 的 代码 称 为 捕获 〈 catch) 
异常 。 

CH 语言 的 异常 处 理 采用 try 语句 ， 其 形式 如 下 所 示 : 
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try { 
code under the control of the try statement 
} catch (type var) ( 
code to respond to an exception with the specified value type 


} 
用 于 抛 出 异常 的 语句 语法 模式 为 : 


throw value; 


“Xia Hi UTE CES TE try 语句 块 的 函数 中 时 ， 程 序 将 会 暂停 执行 正在 执行 的 函数 ， 并 
且 沿 着 函数 调用 链 进行 回 湖 ， 回 退 并 弹出 栈 帧 结构 ， 直 到 到 达 包 含 try 语句 的 栈 点 为 止 。 
假设 throw 语句 中 的 值 与 catch 子 句 中 的 类 型 相 匹配 ， 该 值 value 将 会 被 赋值 给 变 
量 var， 并 将 控制 权 移交 给 catch 子 句 。 在 更 复杂 的 应 用 中 ， 一 个 try 语句 会 拥有 多 个 
catch FAJ, 不同 的 catch 子 句 的 区 别 在 于 其 接受 的 参数 类 型 不 同 。 本 书 中 的 cry 语句 
只 用 于 捕获 error 函数 抛 出 的 ErrorException， 因 此 只 需要 一 个 catch 子 句 。 


19.3.2 ”表达 式 结构 


在 完成 解释 器 的 实现 之 前 ， 你 需要 理解 什么 是 表达 式 ， 以 及 怎样 用 对 象 这 一 概念 去 表示 
一 个 表达 式 。 类 似 于 考虑 怎样 进行 编程 抽象 ， 以 一 个 C++ 程序 员 的 经 验 来 分 析 表 达 式 的 本 
质 是 非常 有 必要 的 。 举 例 来 说 ， 你 知道 以 下 表达 式 : 


0 
2 * 11 
3 * (a * b * c) 


x=x+1 
这 在 C++ 语言 中 是 合法 的 。 同 时 ， 你 也 知道 以 下 文本 行 : 


2* (x-y 
17 k 


这 并 不 是 表达 式 。 第 一 行 的 括号 不 配对 ， 第 二 行 则 缺失 了 操作 符 。 理 解 表达 式 本 质 最 重要 的 
一 点 就 是 弄 清 表达 式 是 由 哪些 部 分 组 成 的 ， 并 且 这 些 部 分 可 以 让 你 分 辨 出 合法 和 不 合法 的 表 
达 式 。 


19.3.3 ”表达 式 的 递归 定义 


就 像 你 所 看 到 的 ， 定 义 合法 表达 式 的 最 佳 方式 就 是 使 用 递归 的 方法 。 一 个 符号 序列 如 果 
符合 以 下 的 任意 一 条 ， 则 该 符号 序列 就 是 一 个 表达 式 : 
1. 符号 序列 是 一 个 整 型 常量 。 
2. 符号 序列 是 一 个 变量 名 。 
3. 符号 序列 是 被 圆 括号 括 起 来 的 一 个 表达 式 。 
4. 符号 序列 是 被 一 个 操作 符 分 割 成 两 部 分 的 两 个 表达 式 序 列 。 
前 两 个 标准 表示 单个 符号 的 场合 。 后 两 个 标准 递归 地 定义 了 由 一 组 独立 表达 式 符号 组 成 新 表 
达 式 的 情况 。 
为 了 理解 怎样 应 用 这 一 递归 的 标准 ， 我 们 考虑 以 下 符号 序列 : 
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y=3* (x + 1) 


这 一 序列 构成 了 一 个 表达 式 吗 ? 根据 经 验 进行 判断 ， 你 得 到 的 答案 是 肯定 的 ， 但 是 你 可 以 通 
过 使 用 表达 式 的 递归 定义 来 检验 你 的 答案 。 根 据 第 一 个 标准 ， 整 型 常量 3 和 1 是 两 个 表达 
式 。 同 样 的 ， 根 据 第 二 个 标准 ， 变 量 名 x 和 y 也 是 表达 式 。 因 此 ， 现 在 你 已 经 知道 下 图 中 
使 用 exp 进行 标记 的 符号 是 表达 式 : 


exp exp exp ep 


此 时 ， 你 可 以 开始 调用 它 的 递归 定义 了 。 给 定 x 和 1 是 表达 式 ， 你 可 以 通过 第 四 个 标 
准 来 判定 符号 x+1 是 一 个 合法 的 表达 式 ， 因 为 这 一 字符 串 包 含 了 两 个 被 操作 符 分 割 开 的 独 
立 表 达 式 。 你 可 以 在 图 中 将 这 一 观察 结果 进行 标记 ， 像 下 面 这 样 增加 一 个 新 的 表达 式 标记 连 
接 到 表达 式 中 符合 该 标准 的 部 分 : 





TOT TA T 
Y = 3 * x + 1 


现在 ， 根 据 第 三 个 标准 ， 圆 括号 中 及 其 包含 的 字符 可 以 被 定义 为 一 个 单独 的 表达 式 ， 这 
一 结果 如 下 图 所 示 : 





e P ep on op 
y = 3 * ( x 十 1 


再 调用 第 四 个 标准 至 少 两 次 ， 考 虑 到 剩 下 的 操作 符 ， 你 可 以 知道 整个 这 些 字符 像 下 面 这 
样 组 成 了 一 个 完整 的 表达 式 : 


正如 你 所 看 到 的 ， 这 个 图 组 成 了 一 个 树 结构 。 树 结构 证 明了 输入 符号 序列 刚好 符合 一 种 编程 
语言 的 语法 规则 ， 这 棵 树 也 被 称 为 解析 树 (parse tree). 
19.3.4 二 义 性 


从 一 个 符号 序列 中 生成 一 棵 解析 树 时 有 几 点 需要 注意 。 根 据 前 一 节 总 结 出 的 四 个 表达 式 
判定 标准 ， 一 个 表达 式 可 能 生成 不 止 一 棵 解析 树 ， 如 以 下 表达 式 : 
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yos* (x + 4) 


虽然 树 结构 在 上 一 节 的 最 后 与 程序 员 预 期 的 大 致 相同 ， 但 是 根据 第 四 个 标准 将 y=3 看 成 一 
个 表达 式 也 是 合法 的 ， 因 此 整个 表达 式 将 包含 子 表达 式 y=3， 并 在 其 后 连接 一 个 乘法 符号 和 
另 一 个 表达 式 (x+1 )。 这 种 操作 最 终 也 达到 了 将 输入 序列 转换 为 表达 式 的 目的 ， 但 是 却 生 
成 了 另外 一 棵 不 同 的 解析 树 。 图 19-10 向 我 们 展示 了 这 两 棵 不 同 的 解析 树 。 左 边 的 解析 树 是 
由 前 一 节 生成 的 ， 与 表达 式 表达 的 语义 一 致 。 右 边 的 解析 树 向 我 们 展示 了 对 表达 式 判 断 标 准 
的 一 次 正确 运用 ,但 得 到 的 结果 与 程序 员 的 预期 设想 相 异 。 











图 19-10 预期 的 解析 树 以 及 合法 却 不 符合 语义 的 解析 树 


第 二 棵 解析 树 中 存在 的 问题 就 是 树 的 生成 过 程 忽略 了 乘法 必须 在 赋值 之 前 执行 这 一 运算 
优先 级 顺序 。 递 归 定 义 只 规定 了 被 一 个 操作 符 分 割 的 两 个 独立 表达 式 可 以 组 成 一 个 表达 式 ; 
但 是 却 没 有 说 明 操作 符 之 间 的 优先 级 关系 ， 因 此 这 一 语法 定义 允许 同时 生成 两 个 不 同 的 结 
果 。 由 于 该 套 标 准 处 理 同 一 个 字符 串 产 生 的 结果 不 具有 唯一 性 ， 所 以 我 们 认为 上 一 节 给 出 的 
表达 式 定义 具有 二 义 性 ( ambiguous)。 为 了 解决 定义 的 二 义 性 ， 语 法 分 析 算 法 必须 包含 某 些 
机 制 以 确保 操作 符 执行 正确 的 操作 符 优先 顺序 。 

怎样 解决 表达 式 二 义 性 这 一 问题 在 19.4 节 中 将 进行 详细 介绍 。 现 在 要 解决 的 有 关 解 析 
树 的 问题 是 : 你 要 怎样 将 一 个 表达 式 表 示 为 某 种 数据 结构 。 为 此 ， 我 们 必须 假设 图 19-10 所 
示 的 解析 树 并 不 是 二 义 的 。 每 一 棵 树 的 结构 都 清晰 地 表示 了 一 个 合法 的 表达 式 的 结构 。 二 义 
性 只 存在 于 将 已 输入 字符 串 转换 为 解析 树 的 阶段 。 在 得 到 正确 的 解析 树 之 后 ， 这 棵 树 的 结构 
将 包含 理解 操作 符 执行 顺序 所 需 的 全 部 信息 。 


19.3.5 ”表达 式 树 


实际 上 ， 解 析 树 中 所 包含 的 信息 远 比 数值 计算 阶段 所 需 的 信息 要 多 。 圆 括号 可 以 在 生 
成 解析 树 阶 段 起 到 重要 作用 ， 但 是 在 表达 式 的 结构 确定 之 后 的 数值 计算 阶段 却 毫 无 意义 。 如 
果 你 只 关心 如 何 得 到 表达 式 的 值 ， 那 么 并 不 需要 在 树 结构 中 包括 圆 括号 。 这 一 结果 允许 你 将 
一 整 棵 解析 树 简化 为 一 个 更 抽象 的 结构 ， 该 结构 称 为 表达 式 树 (expression tree)， 这 一 结构 
更 适合 数值 计算 。 在 表达 式 树 中 ,用 圆 括号 括 起 来 的 子 表达 式 的 节点 被 删除 。 除 此 之 外 ， 取 
消 树 上 的 exp 标记 ， 并 使 用 合适 的 操作 符 符号 来 标记 每 个 节点 将 更 加 简便 。 例 如 ， 以 下 的 表 
达 式 : 

y = 3% (x1) 


表示 为 以 下 表达 式 树 : 


继 X 569 





zx 
a % 
eo, 


表达 式 树 的 结构 与 第 16 章 讲 解 的 二 又 搜索 树 在 很 多 方面 很 类 似 ， 但 是 它们 也 有 某 些 重 
要 的 差别 。 在 二 又 搜索 树 中 ， 每 个 节点 都 有 相同 的 结构 。 在 表达 式 树 中 ， 存 在 以 下 三 种 不 同 
类 型 的 节点 : 

1. 常量 节点 (constant node) 表示 整 型 常量 ， 比 如 上 例 表 达 式 树 中 的 3 和 1。 

2. 标识 符 节点 (identifier node) 表示 了 变量 名 ， 比 如 x 和 y。 

3. 复合 节点 (compound node) 表示 了 将 一 个 操作 符 应 用 到 两 个 操作 数 上 ， 其 中 每 一 个 操作 
数 都 是 另外 一 个 任意 类 型 的 表达 式 。 

每 一 种 节点 类 型 都 对 应 着 表达 式 递归 定义 中 的 某 条 规则 。Expression 类 的 定义 必须 让 用 

户 可 以 操作 全 部 三 种 类 型 的 表达 式 节 点 。 与 此 类 似 ， 该 类 底层 实现 必须 确保 树 中 可 以 同时 存 

在 多 种 不 同 的 表达 式 。 

为 了 表示 这 一 结构 ， 你 必须 将 表达 式 定义 为 可 以 根据 自身 不 同类 型 来 构成 不 同 的 结构 。 
例如 ， 一 个 整 型 表达 式 必 须 将 整 型 数 当 做 内 部 结构 的 一 部 分 进行 存储 。 一 个 标识 符 表达 式 必 
须 包 括 一 个 同时 拥有 左 表达 子 式 和 右 表 达 子 式 的 操作 符 。 定 义 一 个 允许 表达 式 拥有 这 些 底层 
结构 的 抽象 类 型 需要 你 实现 类 的 继承 ， 这 一 继承 层次 使 得 Expression 类 成 为 三 个 子 类 的 父 
类 ， 每 一 个 子 类 都 代表 了 一 种 表达 式 类 型 。 

创建 继承 层次 是 表示 表达 式 树 的 合理 方法 。 这 一 继承 层次 的 顶层 是 Expression 类 ， 
该 类 定义 了 所 有 表达 式 类 型 共有 的 特性 。Expression 类 拥有 三 个 子 类 ， 每 个 子 类 都 表示 
了 一 种 表达 式 类 型 。 上 层 的 Expression 类 , FW ConstantExp 类 、IdentifierExp 
类 和 compoundExp 类 ， 这 四 个 类 都 在 exp. h 文件 中 定义 。 

与 典型 的 类 继承 层次 类 似 ， 大 多 数 共 有 的 方法 定义 在 Expression 类 中 ， 然 后 在 子 类 
中 单独 实现 。 每 一 个 Expression 对 象 都 实现 了 如 下 方法 : 

e eval 方法 计算 出 表达 式 的 值 ， 在 该 应 用 中 该 值 是 一 个 整 型 值 。 对 于 常量 表达 式 来 
Bi, eval 只 是 简单 地 返回 常量 值 。 对 于 标识 符 表达 式 来 说 ，eval 方法 通过 查询 符 
号 表 中 的 标识 符 名 来 计算 表达 式 的 值 。 对 于 组 合 表达 式 来 说 ，eval 方法 通过 递归 地 
调用 左 子 式 和 右 子 式 并 执行 正确 的 操作 符 来 实现 。 
toString 方法 将 表达 式 转 换 成 一 个 字符 串 ， 并 在 表达 式 中 无 差别 地 增加 圆 括 号 来 
明确 地 表示 出 表达 式 的 结构 。 虽 然 tostring 方法 并 不 用 于 解释 器 中 ， 但 这 一 方法 
在 程序 的 编译 查 错 步 又 中 将 起 到 重要 的 作用 。 如 果 你 不 清楚 表达 式 结构 是 否 正确 ， 
可 以 通过 调用 tostring 方法 进行 确认 。 
getType 方法 用 于 计算 表达 式 的 类 型 。 其 返回 类 型 是 ExpressionType KH Pe 
义 的 CONSTANT、IDENTIFIER 或 COMPOUND 枚 举 常量 中 的 一 种 。 

Expression 类 提供 了 一 系列 取 值 方法 ， 这 些 方法 返回 整个 表达 式 结构 中 的 某 些 部 
分 。 在 exp.h 文件 中 ， 取 值 方法 定义 在 抽象 类 中 ， 因 为 这 样 做 将 使 该 类 层次 更 易于 
使 用 。 
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frt Expression 类 中 ， 上 述 方法 都 定义 为 虚 函 数 。 当 程序 执行 时 ， 计 算 机 将 通过 检测 表达 
式 的 实际 类 型 来 决定 调用 哪个 类 的 方法 。 


19.3.6 exPpP .h 接口 


19-11 展示 了 Expression 类 及 其 子 类 的 接口 。 每 一 个 Expression 子 类 都 必须 实 
现 其 父 类 中 定义 的 三 个 纯 虚 方法 : eval, toString 和 getType。 父 类 中 定义 了 这 些 方法 
的 原型 ， 每 个 子 类 负责 使 用 不 同 的 方式 独立 实现 这 些 方法 。 


interface defines a class hierarchy for arithmetic expressions 


#ifndef exp h 
define exp h 


#include «string» 
#include "map.h" 
#include "tokenscanner.h" 


/* 


Forward reference */ 


class EvaluationContext; 


/* 


ExpressionType 


This enumerated type is used to differentiate the three different 
expression types: CONSTANT, IDENTIFIER, and COMPOUND. 


wf 
enum ExpressionType { CONSTANT, IDENTIFIER, COMPOUND }; 


/* 


* 


* 


* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 
* 


/ 


Class: Expression 


This class is used to represent a node in an expression tree. 
Expression itself is an abstract class, which means that there are 
never any objects whose primary type is Expression. All objects are 
instead created using one of the three concrete subclasses: 


1. ConstantExp -- an integer constant 
2. IdentifierExp -- a string representing an identifier 
3. CompoundExp -—- two expressions combined by an operator 


The Expression class defines the interface common to all expressions; 
each subclass provides its own implementation of the common interface 


class Expression ( 


public: 


/* 


* 


Constructor: Expression 


* Specifies the constructor for the base Expression class. Each subclass 
* defines its own constructor as well. 


Expression(); 


Destructor: -Expression 
Usage: delete exp; 


Deallocates the storage for this expression. This method must be 


* declared virtual to ensure that the correct subclass destructor 





is called when deleting an expression. 


图 19-11. exp.h 接口 
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virtual -Expression(); 


* Method: eval 
* Usage: int value exp-»eval(context); 


* Evaluates this expression and returns its value in the context of 
* the specified EvaluationContext object. 


/ 


virtual int eval(EvaluationContext & context) - O0; 


Method: toString 
Usage: string str exp-»toString(); 


Returns a striag representation of this expression. 
virtual std::string toString() = 0; 

Method: getType 

Usage: ExpressionType type exp->get Type () ; 


Returns the type of the expression, which must be one of the constants 
CONSTANT, IDENTIFIER, or COMPOUND. 


virtual ExpressionType getType() = 0; 
/* 


* Getter methods for convenience 


rae ———€——Á—Ó——Á—— 


* The following methods get the fields of the appropriate subclass. Calling 
* these methods on an object of the wrong subclass generates an error 


my 


virtual int getConstantValue() ; 
virtual std::string getIdentifierName() ; 
virtual std::string getOperator(); 
virtual Expression *getLHS() ; 
virtual Expression *getRHS() ; 

}; 

/* 

* Subclass: ConstantExp 


* This subclass represents an integer constant. 
*f 
class ConstantExp : public Expression ( 
public: 
/* 
Constructor: ConstantExp 
Usage: Expression *exp - new ConstantExp(value); 


Creates a new integer constant expression. 
ay 
ConstantExp (int value); 


Prototypes for the virtual methods overridden by this class */ 


virtual int eval (EvaluationContext & context); 
virtual std::string toString(); 

virtual ExpressionType getType() ; 

virtual int getConstant¥elue() ; 


private: 
int value; /* The value of the integer constant */ 


H 


/* 
* Subclass: IdentifierExp 
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* This subclass represents an identifier used as a variable name. 


“y 


class IdentifierExp : public Expression [ 


public: 


Constructor: IdentifierExp 
Usage: Expression *exp - new identifierExp (name); 


Creates an identifier expression with the specified name. 


xf 


IdentifierExp(std::string name); 


/* Prototypes for the virtual methods overridden by this class */ 


virtual int eval(EvaluationContext & context); 
virtual std::string toString(); 


virtual ExpressionType getType(); 
virtual std::string getIdentifierName() ; 


private: s 
std::string name; 
HN 
/* 
Subclass: CompoundExp 


* 


/* The name of the identifier */ 


* This subclass represents a compound expression consisting of 


* two subexpressions joined by an operator. 


*j 


class CompoundExp : public Expression ( 


public: 
/* 


Constructor: CompoundExp 
Usage: Expression *exp - 


new CompoundExp (op, 


lhs, rhs); 


Creates a new compound expression composed of the operator (op) 
and the left and right subexpressions (lhs and rhs). 


CompoundExp(std::string op, Expression *lhs, Expression *rhs); 


/* Prototypes for the virtual methods overridden by this class */ 


virtual ~CompoundExp () ; 


virtual int eval (EvaluationContext & context) ; 
virtual std::string toString(); 
virtual ExpressionType getType(); 
virtual std::string getOperator(); 
virtual Expression *getLHS(); 
virtual Expression *getRHS(); 


private: 


std::string op; 
Expression *lhs, *rhs; 


) 


Class: EvaluationContext 


* This class encapsulates the information tha: 


/* The operator 
/* The left and 


know in order to evaluate an expression. 


class EvaluationContext ( 
public: 
/* 


图 19-11 
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string (+, -, *, /) */ 
right subexpression  */ 


4,& evaluator needs to 


* Method: setValue 
* Usage: context.setValue(var, value); 
* 


* Sets the value associated with the specified var. 
ep 
void setValue(std::string var, int value); 
/* 
* Method: getValue 


* Returns the value associated with the specified variable. 
*7 
int getValue(std::string var); 
/* 
* Method: isDefined 
* Usage: if (context.isDefined(var)) . . . 
* 


* Returns true if the specified variable is defined. 
af 


bool isDefined(std::string var); 
private: 

Map«std::string,int» symbolTable; 
}; 
#endif 





图 19-11 ( 续 ) 


19.3.7 Expression 子 类 的 表示 


抽象 类 Expression 并 没有 声明 实例 变量 。 因 为 在 该 类 层次 中 并 不 存在 所 有 节点 类 型 
共有 的 数据 值 ， 所 以 这 一 设计 是 非常 合理 的 。 每 一 个 子 类 都 有 其 独立 的 数据 存储 需求 ， 一 个 
整 型 节点 需要 存储 一 个 整 型 常量 ,一 个 复合 节点 需要 存储 其 子 表达 式 的 指针 ,以 此 类 推 。 每 
一 个 子 类 都 声明 了 自身 表达 式 类 型 所 需 的 实例 变量 。 每 一 个 子 类 也 同时 定义 了 自己 的 构造 函数 ， 
这 些 构造 函数 都 需要 传人 构成 对 应 类 型 表达 式 所 需 的 参数 。 例 如 ， 为 了 创建 一 个 常量 表达 式 ， 
你 需要 定义 一 个 整 型 数值 。 为 了 构造 一 个 复合 表达 式 ， 你 需要 提供 操作 符 、 左 子 式 和 右 子 式 。 

所 有 的 表达 式 对 象 都 是 不 可 变 的 ， 这 也 意味 着 每 一 个 Expression 对 象 一 旦 创建 就 
不 能 改变 。 虽 然 允 许 用 户 将 一 个 表达 式 骨 入 到 一 个 规模 更 庞大 的 表达 式 中 ， 但 是 接口 并 
不 提供 任何 用 于 改变 已 存在 表达 式 组 成 部 分 的 机 制 。 使 用 不 可 变 类 型 来 表示 表达 式 使 得 
Expression 类 的 实现 与 其 用 户 分 离开 来 。 因 为 用 户 不 再 被 允许 对 底层 实现 做 出 任何 改变 ， 
所 以 用 户 不 能 使 用 违反 表达 式 树 要 求 的 方法 去 改变 其 内 部 结构 。 


19.3.8 ”表达 式 图 解 


为 了 让 你 更 深入 地 理解 Expression 对 象 是 怎样 存储 的 ， 我们 建 模 了 计算 机 内 存 中 这 
一 结构 的 表示 。Expression 对 象 的 表示 取决 于 它 的 特定 子 类 。 你 可 以 通过 将 三 个 子 类 分 
开 单 独 考 虑 的 方式 画 出 表达 式 树 的 结构 。 一 个 ConstantExp 对 象 只 存储 一 个 整 型 值 ， 下 
图 表示 了 其 中 存储 着 整 型 值 3: 


CONSTANT 


3 
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一 个 IdentifierExp 对 象 存储 一 个 代表 变量 名 的 字符 串 ， 该 变量 名 用 变量 x 表示 : 
| IDENTIFIER | 


一 个 CompoundExp 对 象 存储 了 一 个 二 元 操作 符 和 两 个 分 别 表示 左 子 式 和 右 子 式 的 指针 : 


因为 复合 节点 包括 了 自身 可 以 成 为 复合 节点 的 子 表达 式 ， 所 以 一 个 表达 式 树 既 可 以 变 得 
极其 复杂 、 也 可 以 变 得 极其 简单 。 图 19-12 说 明了 以 下 表达 式 的 内 部 数据 结构 : 


Y=3* (x + 1) 


这 一 结构 包含 了 三 个 操作 符 ， 也 因此 需要 三 个 复合 节点 。 在 表达 式 树 中 并 不 显 式 地 出 现 圆 括 
F, 因为 树 结构 中 已 经 清楚 地 说 明了 计算 的 次 序 。 


19.3.9 ”方法 的 实现 
几 个 表达 式 类 共有 的 方法 已 经 被 实现 。 图 19-13 中 是 Expression 类 层次 的 实现 。 






IDENTIFIER 


IDENTIFIER 


857 图 19-12 表达 式 y=3* (x1) 的 内 部 结构 


#include <string> 
finclude "error.h" 
#include "exp.h" 
#anclude "strlib.h" 





图 19-13 exp.h 接口 的 实现 
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using namespace std; 


Implementation notes: Expression 


The Expression class itself implements only those methods that 
are not designated as pure virtual methods 


Expression::Expression() { 
/* Empty */ 


) 


Expression: :~Expression() { 
/* Empty */ 


) 


int Expression::getConstantValue() ( 
error("getConstantValue: Illegal expression type"); 
return 0; 


) 


std::string Expression::getIdentifierName() ( 
error("getlIdentifierName: Illegal expression type"); 
return ""; 


) 


std::string Expression::getOperator() { 
error ("getOperator: Illegal expression type"); 
return ""; 


) 


Expression *Expression::getLHS() ( 
error("getLHS: Illegal expression type"); 
return NULL; 

) 


Expression *Expression::getRHS() ( 
error("getRHS: Illegal expression type"); 
return NULL; 


* implementation notes: ConstantExp 


* The ConstantExp subclass represents an integer constant. The eval 
* method simply returns that value. 
xf 


ConstantExp: :ConstantExp (int value) { 
this-»value = value; 


) 


int ConstantExp::eval(EvaluationContext & context) ( 
return value; 


) 


string ConstantExp::toString() ( 
return integerToString(value); 


) 


ExpressionType ConstantExp::getType() ( 
return CONSTANT; 
) 


int ConstantExp::getConstantValue() ( 
return value; 


) 


Implementation notes: IdentifierExp 


The IdentifierExp subclass represents a variable name. The 
implementation of eval looks up that name in the evaluation context. 


IdentifierExp::IdentifierExp(string name) ( 
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this-»name = name; 


) 


int IdentifierExp::eval(EvaluationContext & context) { 
if (!context.isDefined(name)) error(name + " is undefined"); 
return context .getValue (name); 


) 


string IdentifierExp::toString() ( 
return name; 


) 


ExpressionType IdentifierExp::getType() { 
return IDENTIFIER; 
} 


string IdentifierExp: :getIdentifierName() { 
return name; 


) 


Implementation notes: CompoundExp 


The implementation of eval for CompoundExp evaluates the left and right 
subexpressions recursively and then applies the operator. Assignment is 
treated as a special case because it does not evaluate the left operand. 

#7 

CompoundExp: :CompoundExp (string op, Expression *lhs, Expression *rhs) { 
this-»op = op; 
this->lhs = lhs; 
this->rhs = rhs; 

) 

CompoundExp: :~CompoundExp() ( 
delete lhs; 
delete rhs; 

} 


int CompoundExp::eval(EvaluationContext & context) { 
int right = rhs->eval (context); 
if (op == "z") { 
context . setValue (lhs—>getIdentifierName(), right); 
return right; 
) 
int left - lhs-»eval(context); 
if (op == "+") return left + right; 
if (op == "-") return left - right; 
if (op == "*") return left * right; 
if (op == "/") 
if (right == 0) error("Division by 0"); 
return left / right; 


) 
error("Illegal operator in expression"); 
return 0; 


) 


string CompoundExp::toString() ( 
return '(' + lhs->toString() + ' ' + op + ' ' + rhs-»toString() + ')'; 
) 


ExpressionType CompoundExp::getType() ( 
return COMPOUND; 
) 


string CompoundExp::getOperator() ( 
return op; 
) 


Expression *CompoundExp::getLHS() ( 
return lhs; 
) 


Expression *CompoundExp::getRHS() ( 
return rhs; 
} 


/* 
* Implementation notes: EvaluationContext 





图 19-13 (4) 
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* The methods in the EvaluationContext class simply call the appropriate 
* method on the map used to represent the symbol table. 
sg 


void EvaluationContext::setValue(string var, int value) ( 
symbolTable.put(var, value); 
) 


int EvaluationContext::getValue(string var) ( 
return symbolTable.get (var); 
) 


bool EvaluationContext::isDefined(string var) ( 
return symbolTable.containsKey (var); 


} 





图 19-13 (48) 


Expression 类 的 实现 包括 了 一 个 空 构 造 函 数 、 一 个 空 析 构 函 数 和 默认 实现 的 取 值 方 
法 。 在 exp.h 文件 中 ， 析 构 函 数 使 用 virtual 关键 字 进 行 标 记 ， 这 一 语法 应 该 被 应 用 在 
所 有 其 他 使 用 了 动态 内 存 分 配 的 继承 层次 类 中 。 将 一 个 析 构 函数 标记 为 虚 函 数 确保 了 子 类 可 
以 提供 自己 的 析 构 函数 ， 并 且 自 身 的 析 构 函数 与 父 类 的 析 构 函数 会 被 同时 调用 。 如 果 用 户 调 
用 了 取 值 方法 ， 它 会 报告 一 个 错误 。 因 此 每 一 个 子 类 都 可 以 重 置 取 值 方法 来 应 用 到 自身 数据 
域 ， 并 从 Expression 类 中 继承 其 他 取 值 方法 。 

图 19-13 中 其 他 子 类 的 实现 采用 了 同一 种 模式 。 每 个 子 类 都 定义 了 需要 传人 接口 中 声明 
参数 的 构造 机 数 ， 这 些 构造 函数 使 用 传人 参数 来 初始 化 对 应 的 实例 变量 。 剩 下 大 多 数 子 类 方 
法 的 实现 遵循 了 前 一 个 类 的 结构 。 

eval 方法 的 实现 在 每 个 表达 式 类 型 中 都 不 一 样 。 常 量 表达 式 的 值 是 其 节点 中 存储 的 整 
型 数值 。 标 识 符 表达 式 的 值 是 通过 数值 计算 阶段 生成 的 符号 表 得 来 的 。 复 合 表 达 式 的 值 需 
要 递归 运算 得 到 。 每 一 个 复合 表达 式 由 操作 符 和 两 个 子 表达 式 组 成 。 对 于 四 则 操作 符号 
(+、-、* 和 /) 来 说 ，eval 使 用 递归 运算 分 别 计算 出 左 子 式 和 右 子 式 的 值 ， 之 后 再 将 这 些 
值 应 用 到 对 应 的 操作 符 上 。 但 是 对 于 赋值 操作 符 (=), eval 通过 将 标识 符 右 边 的 值 赋值 给 
标识 符 左 边 的 变量 ， 并 更 新 符号 表 。 


19.4 解析 表达 式 


从 一 个 记号 输入 流 中 提取 出 一 棵 正确 的 解析 树 并 不 是 一 件 简单 的 事 。 建 立 一 个 有 效 的 语 
法 解释 器 在 很 大 程度 上 已 经 超出 了 本 书 讨论 的 范围 。 即 使 这 样 ， 我 们 依旧 可 以 在 这 一 问题 上 
取得 一 些 进展 ， 并 且 将 其 应 用 到 有 限 的 四 则 运算 中 。 


19.4.1 语句 解析 和 语法 


早期 的 编程 语言 中 ， 程 序 员 在 实现 编译 器 的 解释 器 部 分 时 ， 并 没有 过 多 地 考虑 实现 过 程 
的 本 质 思想 。 所 以 ， 早 期 的 解释 器 程序 很 难 编写 ， 也 更 难 进行 编译 。 但 是 在 20 世纪 60 年 
R, 计算机 科学 家 从 一 个 更 加 理论 化 的 层面 对 解释 器 进行 了 研究 ， 这 一 研究 简化 了 解释 器 编 
写 的 难度 。 现 在 ， 一 个 学 习 过 编译 原理 的 计算 机 科学 家 可 以 很 容易 地 为 一 个 编程 语言 创建 一 
个 解释 器 。 实 际 上 ， 我 们 可 以 根据 一 个 编程 语言 的 定义 和 需求 自动 生成 一 个 解释 器 。 在 计算 
机 科学 领域 ， 语 言 解析 这 一 课题 最 容易 看 到 理论 对 实践 产生 的 深远 影响 。 没 有 理论 研究 来 简 
化 这 一 问题 ， 编 程 语 言 就 不 会 取得 如 此 大 的 进步 。 
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简化 语言 解析 的 基础 理论 实际 上 借鉴 于 传统 的 语言 学 。 与 人 类 语言 类 似 ， 编 程 语言 也 具 
有 定义 语言 语法 结构 的 语法 规则 。 除 此 之 外 ， 与 人 类 语言 相 比 ， 编 程 语言 更 依赖 于 语言 的 结 
构 ， 所 以 ,通常 来 说 ,我 们 更 容易 做 到 将 编程 语言 的 语法 结构 描述 为 特定 的 形式 ， 而 这 一 形 
式 也 称 为 语法 ( grammar)。 在 编程 语言 中 ,语法 规则 向 我 们 描述 了 怎样 从 简单 的 语句 出 发 ， 
构造 出 更 加 复杂 的 语言 结构 。 

如 果 你 从 英语 语法 出 发 研究 表达 式 形式 ， 很 容易 就 可 以 写 出 本 章 所 要 求 的 简单 表达 式 
语法 规则 。 部 分 原因 是 在 这 里 我 们 可 以 部 分 简化 这 一 解释 器 ， 简 化 将 体现 在 项 〈term) 这 一 
概念 上 ， 我 们 将 其 看 成 是 一 个 独立 单元 ， 并 且 可 以 在 一 个 更 长 的 表达 式 中 以 操作 数 的 形式 出 
现 。 例 如 常量 或 者 变量 都 是 项 。 此 外 ， 括 号 中 的 表达 式 会 看 作 是 一 个 独立 单元 ， 因 此 该 表达 
式 也 可 以 看 成 一 个 项 。 所 以 ， 项 表示 了 以 下 的 其 中 一 种 含义 : 

e 一 个 整 型 常量 

e 一 个 变量 

e 一 个 括号 中 的 表达 式 
之 后 ,我 们 可 以 将 表达 式 看 成 以 下 的 其 中 一 项 : 

e =A M 

© 被 操作 符 分 割 的 两 个 表达 式 

这 一 非 正 式 定义 可 以 被 直接 转化 为 以 下 语法 ， 并 表示 成 巴克 斯 -诺尔 范式 (Backus-Naur 
Form)， 英 文 简写 为 BNF， 这 由 它 的 发 明 者 约翰 ' 巴 科 斯 和 彼得 … 诺尔 命名 得 来 ， 其 形式 如 下 : 


E = T T — integer 
E — EopE T 一 identifier 
T = (E) 


在 这 一 语法 中 , 像 E 或 了 这 样 的 大 写字 母 称 为 非 终止 符 ( nonterminal symbol), AERAR 
表 了 抽象 的 语言 学 类 型 ， 如 一 个 表达 式 或 者 一 个 项 。 特 殊 的 标点 符号 和 和 斜体 字 表示 一 个 终结 
符 (terminal symbol)， 这 些 符号 出 现在 记号 流 中 。 类 似 最 后 一 条 语法 规则 中 的 圆 括 号 这 样 的 
明确 终结 符 必须 像 规则 中 一 样 确切 地 出 现在 输入 流 中 。 斜 体 字 表示 的 是 对 应 记号 的 占 位 符 。 
因此 ， 符 号 integer 表示 了 扫描 器 以 记号 形式 返回 的 数字 字符 串 。 每 一 个 终结 符 都 对 应 着 扫 
描 器 输入 流 中 的 一 个 记号 。 每 一 个 非 终结 符 都 对 应 着 一 连 串 特定 顺序 的 记号 。 


19.4.2. 考虑 运算 的 优先 级 


与 19.3.3 一 节 中 介绍 的 非 正式 表达 式 定 义 类 似 ， 语 法 可 以 用 来 生成 解析 树 。 与 这 些 规 则 
相同 ， 这 一 语法 在 书写 的 时 候 带 有 二 义 性 ， 并 且 可 以 生成 多 个 带 有 相同 序列 记号 但 结构 不 同 
的 解析 树 。 我 们 发 现 ， 语 法 并 没有 解决 操作 符 与 操作 数 之 间 的 结合 性 问题 。 从 带 二 义 性 的 语 
法 中 生成 正确 的 解析 树 需要 解释 器 拥有 优先 级 信息 。 

定义 优先 级 的 最 简单 方式 就 是 赋予 每 个 操作 符 一 个 表示 优先 级 的 数值 ， 较 高 的 优先 级 权 
值 代表 着 操作 符 与 操作 数 之 间 的 联系 更 加 紧密 。 对 于 四 则 操作 符 以 及 赋值 操作 符 来 说 ， 这 一 
优先 级 信息 可 以 通过 以 下 代码 进行 处 理 : 

int precedence (string token) { 

if (token == "=") return 1; 
if (token == "+" || token == "-") return 2; 


if (token == "*" || token == "/") return 3; 
return 0; 
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an A38 precedence 函数 并 传人 一 个 不 与 任何 一 个 合法 操作 符 相 匹配 的 记号 ， 函 数 将 返 
回 数值 0。 因 此 你 可 以 调用 precedence 函数 并 通过 其 返回 值 来 判断 一 个 记号 是 否 为 合法 
的 操作 符 。 


19.4.3 ”递归 下 降 语 法 分 析 器 


当今 大 多 数 针 对 编程 语言 语法 的 语法 分 析 器 都 采用 解析 生成 器 ( parser generator) 而 自 
动 生成 。 但 是 对 简单 语法 的 处 理 ， 人 工 编程 实现 一 个 语法 分 析 器 并 不 困难 。 最 通用 的 策略 是 
编写 一 个 负责 读 取 语法 中 所 有 非 终结 符 的 函数 。 表 达 式 语法 使 用 非 终 结 符 E 和 T， 所 以 我 们 
的 语法 分 析 器 中 必须 包含 函数 EeaqdE () 和 zeadT () 。 这 些 函 数 都 需要 传人 一 个 记号 扫描 
器 类 型 的 参数 来 完成 对 输入 资源 中 记号 的 读 取 。 在 检查 记号 是 否 违反 语法 规则 的 时 候 ， 我 们 
通常 需要 判断 该 记号 所 适用 的 规则 ， 至 少 对 于 简单 的 语法 检查 来 说 是 这 样 ， 这 一 选择 操作 在 
readE 函数 需要 获得 记号 的 当前 优先 级 信息 的 时 候 将 起 到 关键 作用 。 

readE 函数 和 readT 函数 是 相互 递归 的 。 当 reade 函数 需要 获取 一 个 项 时 ， 它 将 调 
用 readT pha. ARE, readT 函数 通过 调用 readE 函数 来 完成 读 取 括 号 中 表达 式 的 任务 。 
使 用 相互 递归 函数 实现 的 语法 分 析 器 称 为 递归 下 降 语 法 分 析 器 (recursive-descent parser) o 

在 相互 递归 过 程 中 ，reaqE 函数 和 reaaT 函数 通过 调用 合适 的 表达 式 类 构造 器 生成 表达 式 
树 。 例 如 ， 如 果 readT 函数 发 现 一 个 整 型 记号 ， 该 函数 将 分 配 一 个 包含 该 值 的 ConstantExPp 
类 型 节点 。 递 归 函 数 调用 链 中 各 函数 的 返回 值 将 组 成 一 个 表达 式 树 并 将 此 树 返 回 。 

语法 分 析 器 模块 的 实现 如 图 19-14 所 示 。 其 中 比较 复杂 的 部 分 是 readE 函数 的 代码 实 
现 ， 因 为 该 函数 需要 将 优先 级 纳入 函数 操作 范围 。 只 要 在 新 操作 符 优先 级 比 readE ph BUH 
用 者 提供 的 当前 优先 级 高 的 情况 下 ，readE 函数 可 以 创建 一 个 组 合 表达 式 节点 ， 并 将 子 表 
达 式 放置 在 该 操作 符 的 左 子 树 和 右 子 树 中 ， 之 后 函数 将 返回 并 继续 检查 下 一 个 操作 符 。 当 
readE 因数 检测 到 输入 到 达 末 尾 或 者 操作 符 优 先 级 小 于 等 于 当前 优先 级 的 情况 时 ， 该 函数 
将 返回 到 readE 函数 调用 链 中 下 一 个 更 高 层 的 位 置 ， 该 位 置 优先 级 将 比 之 前 更 低 。 在 这 样 
做 之 前 ，readE 函数 必须 将 刚才 还 未 处 理 的 操作 符 记 号 放 回 到 扫描 器 输入 流 中 ， 使 得 在 到 
达 合适 优先 级 层次 时 该 记号 可 以 被 再 次 读 取 。 这 一 工作 是 通过 调用 TokenScanner 类 中 的 
saveToken 函数 来 完成 的 。 


/* 


* File: parser.cpp 
* 


* This file implements the parser.h interface. 
&/ 
#include <iostream> 
#include <string> 
#include "error.h" 
#include "exp.h" 
#include "parser.h" 
#include "strlib.h" 
#include "tokenscanner.h" 
using namespace std; 
/* 


* Implementation notes: parseExp 
* 


* This code just reads an expression and then checks for extra tokens 
wy 





图 19-14 ”表达 式 语法 分 析 器 的 实现 
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Expression *parseExp(TokenScanner & scanner) { 
Expression *exp - readE(scanner, 0); 
if (scanner.hasMoreTokens()) ( 
error ("Unexpected token \"" + scanner.nextToken() + "\""); 


} 


return exp; 


Implementation notes: readE 
Usage: exp = readE(scanner, prec); 


* The implementation of readE uses precedence to resolve the ambiguity in 

* the grammar. At each level, the parser reads operators and subexpressions 
* until it finds an operator whose precedence is greater than that of the 

* prevailing one. When a higher-precedence operator is found, readE calis 

* itself recursively to read that subexpression as a unit. 

* 


/ 


Expression *readE(TokenScanner & scanner, int prec) ( 
Expression *exp - readT (scanner); 
string token; 
while (true) ( 
token - scanner.nextToken(); 
int tprec = precedence (token); 
if (tprec <= prec) break; 
Expression *rhs = readE(scanner, tprec); 
exp = new CompoundExp (token, exp, rhs); 
) 


scanner.saveToken (token); 
return exp; 


Implementation notes: readT 


This function scans a term, which is either an integer, an identifier, 
or a parenthesized subexpression. 


$y 


Expression *readT (TokenScanner & scanner) { 
string token = scanner.nextToken(); 
TokenType type = scanner.getTokenType (token); 
if (type == WORD) return new IdentifierExp (token); 
if (type == NUMBER) return new ConstantExp (stringToInteger (token)); 
if (token != "(") error("Unexpected token \"" + token + "\""); 
Expression *exp - readE(scanner, 0); 
if (scanner.nextToken() != ")") { 
error("Unbalanced parentheses"); 
) 
return exp; 


Implementation notes: precedence 
This function checks the token against each of the defined operators 
and returns the appropriate precedence value. 


*/ 


int precedence(string token) ( 
if (token == "z") return 1; 
if (token == "+" || token == "-") return 2; 
if (token == "*" || token == "/") return 3; 
return 0; 





图 19-14 ( 续 ) 


以 我 的 教学 经 验 ， 想 要 在 不 观察 readE 函数 运行 实例 的 情况 下 理解 该 函数 的 代码 几乎 
是 不 可 能 的 。 在 这 一 节 的 剩余 部 分 将 分 析 扫 描 器 中 调用 parseExp 函数 时 ， 程 序 后 台 处 理 
的 细节 : 
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在 这 个 表达 式 中 ， 首 先 计算 乘法 ， 之 后 是 加 法 ， 最 后 是 对 变量 进行 赋值 。 其 中 ， 我 们 感 兴趣 
的 是 : 语法 分 析 器 是 怎样 生成 这 一 运算 顺序 并 构造 正确 的 表达 式 树 的 。 
一 次 一 行 地 分 析 这 一 表达 式 的 处 理 过 程 将 显得 太 过 复杂 。 我 们 采用 一 个 更 加 实际 有 效 
的 方法 来 进行 分 析 ， 这 一 方法 只 列 出 处 理 过 程 中 的 几 个 关键 点 。 更 特别 的 是 ， 我 们 必须 了 解 
nextToken 函数 和 readT 函数 的 实现 细节 ， 并 对 这 两 个 函数 每 一 次 的 调用 结果 进行 精确 865 
预测 。 866 
在 第 一 次 调用 readE 函数 时 ,代码 将 读 取 第 一 项 和 在 其 之 后 的 记号 ， 在 这 里 ， 读 取 到 
的 记号 是 赋值 操作 符 。= 操作 符 对 应 的 优先 级 为 1， 这 比 当 前 优先 级 0 更 大 。 因 此 第 一 次 调 
用 readE 哺 数 后 程序 状态 如 下 图 所 示 : 
Expression *exp = readT (scanner); 
string token; 
while (true) { 
token = scanner.nextToken(); 
int tprec = precedence (token); 
if (tprec <= prec) break; 
ey Expression *rhs = readE(scanner, tprec); 
exp = new CompoundExp (token, exp, rhs) ; 
) 


scanner.saveToken (token) ; 


return exp; | 
) | 
tprec token | 


接 下 来 ， 语 法 分 析 器 必须 读 取 赋 值 操 作 符 的 右 操作 数 ， ， 这 一 操作 需要 通过 递归 调用 readE 
函数 来 完成 。 该 次 调用 与 之 前 类 似 , 但 是 调用 的 当前 优先 级 不 同 ， 是 1。 运 算 完 成 后 程序 处 
于 如 下 状态 : 




























Expression *readE (Tokenscanner & i scanner, int prec) { 
Expression *exp = readT (scanner); 





string token; 
while (true) { 
token = scanner.nextToken () ; 
int tprec = precedence (token) ; 
if (tprec <= prec) break; 
v Expression *rhs = readE(scanner, tprec) ; 
exp = new CompoundExp (token, exp, rhs) ; 
} 
scanner . saveToken (token) ; 


| return exp; | 
EE | 
1 | 
|| | 


这 一 优先 级 别 的 处 理 过 程 只 负责 读 取 以 记号 2 开始 的 子 表达 式 。 在 该 层 调用 之 下 的 栈 帧 结构 
依旧 保留 着 之 前 语法 分 析 器 的 工作 状态 使 得 递归 调用 得 以 实现 。 
在 这 里 ， 语 法 分 析 器 将 执行 另 一 次 对 readE 函数 的 递归 调用 ， 并 传人 * 操作 符 的 优先 
级 ， 该 优先 级 的 值 为 3。 然 而 在 该 次 调用 之 后 ， 记 号 流 中 的 下 一 个 是 + 操作 符 ， 其 优先 级 比 
该 次 调用 的 优先 级 要 低 ， 所 以 程序 将 退出 这 一 递归 循环 进入 以 下 状态 : 
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Expression *readE (TokenScanner & scanner, int prec) { 


Expression *readE (TokenScanner & & scanner, int prec) { t 
Expression *readE(TokenScanner & scanner, int prec) { 
Expression *exp = readT (scanner); 
string token; 
while (true) ( 
token - scanner.nextToken(); 
int tprec = precedence (token); 
if (tprec <= prec) break; 
Expression *rhs = readE (scanner, tprec); 
exp = new CompoundExp (token, exp, rhs); 


SE m- <= 


"— Hu" 并 将 表达 式 标记 返 回 到 最 近 一 次 函数 调用 点 。 
readE 函数 的 调用 结果 给 变量 chs 进行 了 赋值 如 下 图 所 示 : 





Expression *readE (TokenScanner & scanner, int prec) ( 
Expression *exp - readT (scanner); 
string token; 
while (true) ( 
token = scanner.nextToken () ; 
int tprec = precedence (token) ; 
if (tprec <= prec) break; 
Expression *rhs = readE(scanner, tprec) ; 
1 exp = new CompoundExp (token, exp, rhs); 
} 
scanner. saveToken (token) ; 
return exp; 


WX <a 


执行 完 这 一 步 ， 语 法 分 析 器 将 合并 exp fll rns 表达 式 ， ， 使 之 成 为 一 个 新 的 组 全 表达 

式 。 在 这 一 阶段 计算 产生 的 值 还 不 足以 作为 程序 运行 的 最 终 值 加 以 返回 , 但 是 该 值 将 被 赋值 

868] 给 变量 exp。 之 后 语法 分 析 器 再 次 执行 while 循环 ， 并 第 二 次 读 取 记 号 +。 然而 在 这 一 次 
循环 中 ，+ 记号 将 比 赋值 操作 符 拥有 更 高 的 优先 级 。 所 以 程序 的 状态 将 产生 如 下 改变 : 





Expression *readE(TokenScanner & scanner, int prec) " 
Expression *exp - readT(scanner); 
string token; 
while (true) { 
token = scanner.next Token () ; 
int tprec = precedence (token) ; 
if (tprec <= prec) break; 
«gy Expression *rhs = readE (scanner, tprec) ; 
exp = new CompoundExp (token, exp, rhs) ; 
) 
scanner.saveToken (token) ; 
return exp; 


| scanner prec token 
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如 果 需 要 ， 虽 然 你 可 以 认真 核查 上 述 步 又， 但 是 现在 你 可 以 应 用 递归 的 稳步 跳跃 这 一 机 
制 。 此 时 ， 扫 描 器 仅 包含 一 个 单一 的 记号 ， 即 整数 1。 假 定 你 已 经 看 到 了 语法 分 析 器 读 取 了 
整数 2， 那么 你 就 能 够 跳 到 下 一 行 继续 执行 : 





Expression | *readE(TokenScanner & scanner, ; int prec) { | 













Expression *readE (TokenScanner & scanner, int prec) { 
Expression *exp = readT (scanner); 
string token; 
while (true) ( 
token = scanner.nextToken(); 
int tprec - precedence (token); 
if (tprec «- prec) break; 
Expression *rhs - readE (scanner, tprec); 
eo exp = new CompoundExp (token, exp, rhs) ; 
) 
Scanner.saveToken (token) ; 


tprec rae 






return exp 
语法 分 析 器 将 exp Ar rhs —— 始 while 的 下 一 个 循环 。 


在 下 一 个 循环 ，token REL aci eric "id 字符 串 并 不 是 一 个 
合法 的 操作 符 ， 因 此 ，precedence 函数 的 返回 值 为 0， 它 表明 该 操作 的 优先 级 比 普通 的 优 — [869] 
先 级 更 低 。 因 此 语法 分 析 器 从 while 循环 中 退出 ， 并 得 到 了 如 下 的 程序 执行 状态 : 














| Expression "*readE (TokenScanner E scanner, int prec) { 
Expression *exp = readT (scanner); 

string token; 

while (true) ( 

token = scanner.nextToken(); 

int tprec = precedence (token); 

if (tprec «- prec) break; 

Expression *rhs = readE(scanner, tprec); 

exp = new CompoundExp (token, exp, rhs) ; 


CET prec tprec token FE | 


UH MUS 一 次 调用 的 re readE E BC EMT, 完成 最 后 计算 的 所 有 必要 信 





| Expression *readE(TokenScanner & scanner, int prec) { | 
Expression *exp = FeadT (scanner); 
string token; 
while (true) { 
token = scanner.nextToken(); 
int tprec - precedence (token); 
if (tprec «- prec) break; 
Expression *rhs = readE (scanner, tprec); 


M exp = new CompoundExp (token, exp, rhs) ; 


scanner .saveToken (token) ; 


return exp; 
ETELE <a tprec token 
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readE 函数 的 任务 就 是 再 次 读 取 一 个 空 记号 ， 创 建 一 个 新 的 复合 表达 式 ， 同 时 向 parseExp 
函数 返回 表达 式 树 的 最 终 版 本 : 


FN, 

odd + 
Fa 

FAs 


19.5 多重 继承 


C++ 语言 与 其 他 大 多 数 面向 对 象 语言 的 最 大 区 别 在 于 : C++ 语言 中 的 类 可 以 继承 自 多 个 
父 类 。 这 一 特性 被 称 为 多 重 继承 (multiple inheritance) 。 虽 然 多 重 继承 使 得 类 继承 变 得 更 加 
难以 理解 ， 但 是 这 一 特性 在 C++ 类 库 中 被 多 次 应 用 ， 所 以 本 书 将 对 其 进行 介绍 。 


19.5.1 stream 类 库 中 的 多 重 继承 


虽然 第 4 章 已 经 对 流 类 进行 了 介绍 ， 但 是 在 涉及 多 重 继承 这 一 特性 时 ， 我们 只 是 一 
笔 带 过 。 在 流 类 库 中 包含 了 同时 处 理 输入 流 和 输出 流 的 类 ， 我们 在 这 些 类 中 应 用 了 多 重 继 
承 。 图 19-15 是 之 前 图 4-7 中 UML 图 的 一 个 新 版 本 ,该 图 向 我 们 说 明了 整个 流 类 层次 。 最 
底层 的 fstream 类 同时 也 是 一 个 ijostream 类 ,可 以 看 到 ，iostream 类 的 左 箭头 指 问 
了 istream 类 。 所 以 fstream 类 将 继承 istream 类 中 的 所 有 方法 。 与 此 同时 ,我 们 可 
以 追溯 iostream 类 的 右 箭 头 ， 发 现 fstream 类 同时 也 是 ostream 类 型 ， 这 也 意味 着 
fstream 类 继承 了 ostream 类 的 所 有 方法 。 









get () 
unget () 
>> 





















ístringstream(:) 


iostream 


< x 











open (csir) 
close() 


open (cstr) 
close() 





NEN 
open (cst) stringstream(:) 
close() str() 

19-15 ” 流 类 的 多 重 继承 层次 


作为 一 个 例子 ， 我 们 来 了 解 一 下 如 何 使 用 双向 数据 流 ， 假设 你 需要 编写 一 个 round 
ToSignificantDigits 函数 ,该 函数 为 变量 x 传人 一 个 float 类 型 的 数值 ， 并 将 其 转换 
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为 一 个 具有 指定 位 数 有 效 数字 的 小 数 。 例 如 ， 如 果 你 这 样 调 用 函数 : 
roundToSignificantDigits(3.14159265, 5) 


函数 将 返回 一 个 只 保留 五 位 有 效 数 字 的 圆周 率 m 值 ， 该 值 为 3.1416。 虽 然 我 们 可 以 通过 其 
他 方式 来 编写 这 一 函数 ， 但 是 最 简单 的 实现 方法 是 使 用 流 类 中 提供 的 函数 。 你 需要 将 变量 
x 写 入 到 设 定 了 接受 数字 有 效 位 数 的 输出 流 中 ， 之 后 将 该 值 从 输入 流 中 读 出 并 重新 转换 为 数 
值 。 下 面 的 代码 就 运用 了 这 一 策略 ， 并 使 用 了 既 继承 自 istream 类 又 继承 自 ostream% 
的 stringstream 类 对 象 来 保存 中 间 字 符 串 : 
double roundToSignificantDigits (double x, int nDigits) { 

stringstream ss; 

ss << setprecision(nDigits) «« x; 

ss >> x; 


return x; 


} 
19.5.2 在 Gobject 继 承 层 次 中 添加 GFillable 类 


为 了 证 明 多 重 继承 在 编程 应 用 中 具有 重要 的 作用 ， 我 们 必须 回顾 19.2 节 介 绍 的 
Gobject 类 。 之 前 我 们 早已 完成 该 类 的 继承 层次 ， 其 中 GRect 和 Goval 类 都 提供 了 
setFilled 方 法 ， 该 方法 允许 用 户 对 图 形 对象 是 空心 还 是 实心 进行 设置 。 默 认 情 况 下 ， 绘 
制 出 的 矩形 和 椭圆 形 是 空心 的 ， 但 是 用 户 可 以 通过 调用 setFilled(true) 方法 对 这 一 设 
置 进行 更 改 。 

图 19-4 中 的 代码 实现 了 GRect 类 和 Goval 类 的 setFilled 方 法， 图 中 该 方法 的 不 
同 版 本 实现 代码 是 一 样 的 。 通 常 ， 有 经 验 的 程序 员 如 非 必 要 ,会 尽量 回避 重复 代码 。 而 多 重 
继承 则 提供 了 用 于 削减 重复 代码 的 机 制 。 在 上 述 例子 中 ，GRect 类 和 GOval 类 已 经 继承 了 
GObject 类 ， 如 果 它 们 再 继承 一 个 称 为 GFillable HH, Ml setFilled 方法 可 以 选择 
定义 在 GFillable 类 中 。 图 19-17 向 我 们 展示 了 描绘 图 19-16 中 GObject 类 层次 的 UML 
图 和 GFillabel 类 的 实现 代码 。 








|  GFillable | llable 


lerillable() | 0 
setFilled (flag) 


GOval (x, y, lgoval tr, y, widik, heiphi) | height) 
draw (gw) 


图 19-16 包含 GFillable 类 的 图 形 类 层次 












setLocation (x, y) 
move (dx, dy) 
setColor (color) 
draw(gw) 


class GFillable ( 


图 19-17 GFillable 类 
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* Constructor: GFillable 


* Ensures that fillable shapes are created as outlines by default. 
wy 


GFillable() ( 
fillFlag - false; 
) 
/* 
* Method: setFilled 
* Y ges shape .setFilled(flag) ; 


* Sets the fill status for shape, where false is outlined and true is filled. 
*/ 


void setFilled(bool flag) { 
fillFlag - flag; 
) 


protected: 
bool fillFlag; /* Flag is false for outline, true for solid fill */ 
J: 





图 19-17. (5&) 


19.5.8 多重 继承 的 危险 性 


虽然 多 重 继承 的 概念 在 抽象 层面 上 并 不 难 理解 ， 但 是 将 其 应 用 到 实际 编程 中 却 可 能 导致 
一 些 程序 变 得 复杂 和 模糊 不 清 。 例 如 ， 多 重 继承 可 能 导致 多 个 父 类 中 拥有 相同 的 方法 名 和 数 
据 域名 ， 这 一 结果 使 得 父 类 被 继承 时 名 称 的 使 用 发 生 混乱 ， 我 们 很 难 判断 一 个 方法 或 者 数据 
域 到 底 继承 自 哪 一 个 父 类 。 这 一 问题 应 该 引起 足够 的 重视 ， 所 以 Java 语言 的 发 明 者 在 设计 
编程 语言 时 决定 不 采用 多 重 继 承 机 制 。 

虽然 多 重 继承 机 制 已 经 应 用 在 C++ 语言 编程 中 的 部 分 场合 ， 考 虑 到 在 C++ 语言 中 单 重 
继承 在 应 用 时 已 经 足够 复杂 ， 采 用 多 重 继承 机 制 将 进一步 增加 C++ 语言 的 复杂 性 和 编程 时 
错误 概率 ， 所 以 我 们 最 好 避免 使 用 多 重 继承 ， 与 此 同时 ， 又 应 能 够 完全 理解 应 用 这 一 机 制 的 
代码 。 


本 章 小 结 
在 这 一 章 ， 你 已 经 学 习 了 如 何 使 用 C++ 语言 中 的 继承 ， 也 接触 了 对 这 一 概念 的 多 个 实 
际 应 用 。 特 别 是 19.3 节 和 19.4 节 ， 我 们 了 解 了 编译 器 编写 人 员 是 如 何 运用 继承 层次 结构 来 
表示 算术 表达 式 的 。 
本 章 的 重点 包括 : 
e C++ 语言 允许 子 类 继承 父 类 的 公有 和 保护 部 分 。 在 这 一 继承 方式 中 ， 定 义 子 类 的 
C++ 语法 如 下 所 示 : 
class subclass : public superclass ( 


new entries for the subclass 


}; 

e 与 大 多 数 面向 对 象 编程 语言 相反 ，C++ 语言 并 不 能 将 子 类 对 象 赋值 给 父 类 对 象 ， 这 
样 做 将 导致 数据 丢失 。 实 际 上 ， 将 对 象 指 针 而 不 是 对 象 本 身 应 用 到 继承 中 是 很 有 用 
的 。 不 幸 的 是 ， 指 针 的 直接 访问 和 操作 要 求 用 户 在 内 存 管 理 上 担负 更 多 责任 ， 这 一 
特点 也 使 得 C++ 语言 的 继承 机 制 变 得 更 加 难以 使 用 。 
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类 中 的 方法 并 不 会 因为 子 类 中 的 方法 定义 而 被 自动 重 置 。 在 C++ 语言 中 ， 只 有 使 用 
关键 字 virtual 进行 标记 的 方法 会 被 重 置 。 

只 在 子 类 中 有 实现 的 函数 称 为 纯 虚 (pure virtual) 函数 。 这 类 函数 在 接口 声明 文件 中 
的 函数 原型 之 后 使 用 =0 进行 标记 。 

C++ 语言 中 的 类 同时 包含 了 protected 部分、 public 部 分 和 private 部 分 。 
protected 部 分 中 的 声明 只 在 类 本 身 以 及 子 类 中 起 作用 ， 而 且 用 户 不 能 访问 。 
调用 子 类 的 构造 函数 时 ， 将 同时 调用 父 类 的 构造 函数 。 在 缺少 其 他 定义 的 情况 下 ， 
即使 用 户 提 供 的 初始 化 列表 所 包含 的 信息 足以 调用 其 他 版 本 构造 函数 ，C++ 也 将 调 
用 默认 构造 函数 。 

C++ 语言 中 包含 了 try 语句 ， 该 语句 允许 编程 人 员 对 程序 运行 过 程 中 发 生 的 异常 状 
态 作 出 响应 。try 语句 的 最 简化 形式 如 下 所 示 : 


try { 
code under the control of the try statement 

) catch (ipe var) { 
code to respond to an exception with the specified value type 


) 

为 了 抛 出 一 个 异常 ， 我 们 使 用 关键 字 throw， 并 在 后 面 附 上 一 个 值 。 

编程 语言 中 的 表达 式 具 有 递归 结构 。 简 单 的 表达 式 包括 了 常量 和 变量 名 。 更 复杂 的 
表达 式 将 简单 的 子 表 达 式 组 合 起 来 构成 一 个 更 大 的 单元 ， 该 单元 具有 层次 结构 ， 可 
以 表示 为 一 棵 树 。 

继承 机 制 使 得 定义 一 组 用 来 表示 表达 式 树 节点 ， 并 具有 特定 结构 层次 的 类 变 得 更 加 
简单 。 

从 用 户 处 读 取 表达 式 的 过 程 可 以 被 分 为 以 下 几 个 阶段 : 输入 、 词 法 分 析 和 语法 分 析 。 
输入 阶段 最 简单 ， 只 是 从 用 户 处 读 取 一 个 字符 串 。 词 法 分 析 将 字符 串 划分 为 记号 形 
X, 这些 记 号 与 我 们 第 6 章 中 介绍 的 TokenSscanner 类 处 理 的 记号 具有 相似 模式 。 
语法 分 析 阶 段 将 词法 分 析 阶 段 返回 的 记号 转换 为 内 部 表现 形式 ， 并 在 其 中 附 上 称 为 
语法 句 型 表达 规则 。 

对 于 大 多 数 语 法 来 说 ， 我 们 可 以 使 用 递归 向 下 策略 来 处 理 转换 问题 。 在 一 个 递归 向 
下 语法 分 析 器 中 ， 语 法 规则 被 编码 成 一 系列 相互 递归 的 函数 。 

一 旦 转换 完毕 ,我们 可 以 在 表达 式 树 上 进行 与 第 16 章 相似 的 递归 操作 。 在 解释 器 执 
行 过 程 中 ,最 重要 的 一 个 操作 就 是 处 理 表达 式 树 ,该 处 理 过 程 包括 递归 地 遍历 树 并 
计算 其 最 终 值 。 

C++ 语言 允许 类 继承 自 多 个 父 类 ， 这 一 技术 称 为 多 重 继承 。 虽 然 多 重 继承 在 某 些 
情况 下 能 起 到 重要 的 作用 ， 但 是 这 一 机 制 增加 了 程序 的 复杂 性 ， 这 一 复杂 性 体现 在 
C++ 语言 自身 设计 以 及 应 用 这 一 机 制 的 程序 编写 中 。 


复习 题 

1. 在 C++ 语言 中 ， 你 会 如 何 定义 Sub 类 的 首部 ， 使 该 类 继承 了 super 类 所 有 公有 部 分 ? 

2. 判断 题 : 在 定义 一 个 新 类 时 ， 该 类 的 父 类 可 以 是 不 带 有 实例 化 模板 类 型 的 模板 类 。 

3. 判断 题 : 与 大 多 数 面向 对 象 编程 语言 类 似 ，C++ 子 类 中 方法 的 定义 将 自动 重 置 父 类 中 的 方法 。 
4. 使 用 你 自己 的 语言 描述 关键 词 virtual 的 作用 。 
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5. 什么 是 纯 虚 方法 ? 这 一 结构 具有 什么 作用 ? 
6. C++ 语言 中 使 用 什么 语法 来 标记 一 个 纯 虚 方法 ? 
7. 什么 是 抽象 类 ? 抽象 类 可 以 提供 自身 方法 的 定义 吗 ? 
8. 术语 切片 是 什么 意思 ? 
9. 当 你 将 继承 层次 中 某 个 类 的 对 象 存储 到 集合 中 时 ， 是 否 有 必要 使 用 指向 分 配 在 存储 空间 别处 的 该 对 
象 的 指针 ， 还 是 直接 存储 该 对 象 本 身 ? 
10. 图 19-3 中 Gobject 类 继承 层次 中 有 哪些 类 和 方法 是 虚拟 方法 ? 
11. 类 中 protected 部 分 的 访问 度 与 public M private 部 分 有 何 区 别 ? 
12. 什么 是 初始 化 列表 ? 该 列表 出 现在 C++ 语言 编程 的 什么 地 方 ? 
13. 解释 器 和 编译 器 之 间 有 什么 区 别 ? 
14. 什么 是 读 取 — 求 值 - 输出 循环 ? 
15. 读 取 表 达 式 包含 了 哪 几 个 阶段 ? 
16. 什么 是 异常 ? 
17. 在 只 捕获 一 个 异常 类 的 最 简单 情况 下 ，C++ 语言 中 try 语句 的 语法 是 什么 样 的 ? 
18. 陈述 本 章 介 绍 的 表达 式 递 归 定 义 。 
19. 根据 本 章 的 表达 式 定义 ， 判 断 以 下 哪 一 行 是 合法 表达 式 : 
a. (((0))) 
b. 2x * 3y 
c. x - (y * (x / y)) 
d. -y 
e x= (y=2* x - 3 * y) 
f 10-948/7*6-5*«4*3/2-1 
20. 给 上 一 道 题 中 所 有 合法 表达 式 画 一 棵 语法 解析 树 ， 该 树 必须 反映 出 数学 中 的 标准 操作 符 优先 级 。 
21. 对 于 19 题 中 合法 表达 式 来 说 ， 哪 一 个 与 简单 的 表达 式 递归 定义 原则 相 违背 。 
22. 分 析 树 和 表达 式 树 之 间 有 什么 不 同 ? 
23. 表达 式 树 中 可 以 出 现 哪 三 种 类 型 的 表达 式 ? 
24. 判断 题 exp .h 接口 中 的 方法 并 不 直接 获取 Expression 对 象 ， 而 是 使 用 指针 指向 Expression 
对 象 。 
25. Expression 类 中 有 哪些 公共 方法 ? 
26. 使 用 图 19-12 作为 模型 ， 画 出 以 下 表达 式 的 结构 图 : 


y = (x +1) / (x - 2) 


27. 为 什么 说 语法 在 编程 语言 中 具有 重要 的 作用 ? 

28. BNF 这 一 缩写 中 的 每 个 字母 都 有 什么 含义 ? 

29. 在 语法 中 ， 终 结 符 和 非 终 结 符 有 什么 不 同 ? 

30. 什么 是 递归 下 降 语法 分 析 器 ? 

31. 在 已 经 实现 的 语法 分 析 器 中 ，readE 函数 的 第 二 个 参数 有 什么 意义 ? 

32. 观察 图 19-14 中 的 readT 函数 定义 ， 你 会 发 现 函 数 体 中 不 包含 任何 对 readT 函数 本 身 的 调用 。 请 
fal readT 函数 是 否 是 一 个 递归 孔 数 ? 

33. f£ CompoundExp 子 类 的 实现 中 ， 为 何在 运算 操作 符 中 使 用 不 同 的 方法 处 理 = 操作 符 。 

34. 什么 是 多 重 继承 ? 

35. 判断 题 : 多 重 继承 在 C++ 中 起 到 了 重要 的 作用 ， 所 以 Java 语言 的 设计 者 在 设计 Java 语言 时 也 采用 
了 这 一 机 制 。 
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习题 

1. 通过 在 Employee 类 的 私有 部 分 中 加 入 必要 的 实例 变量 ， 并 实现 类 中 的 方法 补 全 Employee 类 继 
承 层 次 的 定义 。 设 计 一 个 简单 的 程序 来 测试 你 的 代码 。 

2. 在 Gobject 继承 层次 中 增加 一 个 新 的 square 子 类 ， 该 子 类 的 构造 函数 需要 传人 图 形 左 上 角 坐 标 
和 图 形 的 大 小 。 

3. 在 图 19-5 的 Gobject 类 中 增加 纯 虚 方法 : 


virtual bool contains(double x, double y) = 0; 


之 后 在 各 子 类 中 实现 这 一 方法 。 对 于 子 类 GRect 类 和 Goval 类 来 说 ， 如 果 定 义 的 点 在 对 象 图 形 中 ， 
则 contains 方法 必须 返回 true， 如 果 在 图 形 外 ， 则 返回 false。 对 于 GLine 类 来 说 ， 当 点 线 距 离 
在 半 个 像素 以 内 时 ，contains 方法 返回 true。 如 果 你 并 不 确定 怎样 判断 一 个 点 是 否 在 GOval 
对 象 中 ,或 者 不 知道 怎样 计算 点 到 线 的 距离 ， 你 应 该 像 一 个 专业 程序 员 一 样 : 在 网 上 查找 答案 。 

4. 图 19-8 中 的 TestGObjects 程序 使 用 一 个 矢量 来 保存 图 形 对 象 。 这 一 技术 有 效 地 将 多 个 对 象 封装 
在 一 个 类 中 。 请 实现 一 个 新 的 DisplayList 类 ， 该 类 继承 自 Vector<GObject *> 类 ,同时 也 
提供 了 更 多 像 图 19-18 中 一 样 可 以 更 好 处 理 图 像 的 方法 。 

.从 第 4 题 中 DisplayList 类 的 实现 开始 ， 在 类 中 增加 一 个 getElementAt (x, y) 方法 ， 返回 一 
个 最 接近 图 形 窗口 前 端 图 形 大 小 的 GObject 对 象 指针 ， 该 对 象 包含 了 点 (x, y)。 为 了 完成 这 一 目标 ， 
你 需要 使 用 习题 3 中 的 gobjects .h 接口 ， 并 应 用 其 中 的 contains 方法 。 

.将 图 19-17 中 的 GFillable 类 的 代码 集成 到 Gobject 继承 层次 中 。 编 写 一 个 测试 程序 显示 所 有 
实心 和 空心 的 图 形 。 


Un 


CN 


displaylist.h 


5 file defines a DisplayList class that maintains à list of graphical 


#ifndef displaylist h 
#define displaylist h 


#include "gobjects.h" 
#include "gwindow.h" 


DisplayList 


This class is a vector of graphical objects arranged from back to front. 


* The individual elements of the DisplayList are pointers to GObjects. 
T 


class DisplayList : public Vector<GObject *> ( 


public: 


* Methods: moveTcFront, moveToBack, moveForward, moveBackward 
Usage: list,moveToFront (obj); 
list .moveToBack (obj); 
list .moveForward (obj) ; 
list moveBackward (obj); 


Tbese methods change the position of obj in the DisplayList. The first 
two methods move the object all the way to the specified end.: The last 
two move it one position in the indicated direction, if possible. Each 
of these method signals an error if obj is not in the DisplayList 


void moveToFront (GObject *obj); 
void moveToBack(GObject *obj); 





图 19-18 displaylist.h 接口 
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void moveForward(GObject *obj); 
void moveBackward(GObject *obj); 


* Method: draw 
* Usage: list.draw(gw); 


* Draws the GObjects in the DisplayList on the graphics window. The 


* objects are drawn from back to front, so that objects closer to the 
* front seem to cover those further back 


void draw(GWindow & gw) const; 
F 
#endif 





图 19-18 (£X) 


7. 在 有 关 后 台 追 踪 的 讨论 中 ， 第 9 章 介 绍 了 一 个 基于 最 小 最 大 算法 的 两 人 游戏 实现 大 纲 。 在 之 前 的 章 


节 中 ， 要 将 最 小 最 大 算法 进行 封装 ， 同 时 又 允许 代码 被 许多 不 同 游戏 共享 是 很 困难 的 。 模 板 和 继承 
的 结合 使 得 为 两 人 游戏 定义 一 个 易于 被 其 他 游戏 进行 扩展 的 基 类 变 得 更 加 简单 。 

设计 并 实现 一 个 叫做 TwoPlayerGame 的 模板 类 ， 该 类 获取 一 个 特定 类 型 的 参数 ， 该 类 
型 是 一 个 模板 类 ， 表 示 游 戏 中 的 一 步 移动 。 其 他 类 可 以 通过 重 置 方法 来 扩展 该 类 并 应 用 于 特定 
的 游戏 ， 其 中 最 小 最 大 算法 只 在 函数 中 单独 实现 。 举 例 来 说 ， 第 9 章 中 介绍 的 拿 子 游戏 类 定义 
WTF: 
class NimGame : public TwoPlayerGame<NimMove> { 

code specific to the Nim game 
hi 
NimMove 类 型 与 拿 子 游戏 中 实现 的 Move 类 型 定义 方式 一 致 。 在 第 9 章 介绍 最 大 最 小 算法 时 ， 该 类 
型 被 命名 为 Move。 声 明 模 板 类 使 得 类 型 的 名 称 变 得 更 加 具体 。 

通过 完成 对 Nim 游戏 的 定义 来 测试 TwoPlayerGame 类 的 实现 。 当 你 的 Nim 游戏 定义 完成 并 
成 功 运行 后 ， 实 现 第 9 章 习 题 中 男 一 个 两 人 游戏 来 证 明 该 类 的 灵活 性 。 


8. 对 19.3 节 中 介绍 的 解释 器 进行 必要 的 改造 ， 使 得 表达 式 中 可 以 包括 操作 符 S, 这 一 操作 符 与 * 和 / 


具有 相同 的 优先 级 。 


9. 改 造 你 的 解释 器 ， 使 得 程序 可 以 计算 double 类 型 的 数值 ， 而 不 是 int 类 型 的 数值 。 
10. 使 用 exp.h 接口 中 提供 的 Expression 类 继承 层次 ， 编 写 一 个 函数 : 


void listVariables(Expression *exp); 

它 输出 表达 式 中 的 变量 名 称 。 变 量 名 每 行 输出 一 个 ， 并 且 按 字母 顺序 排列 ， 例 如 ， 如 果 你 对 以 下 
表达 式 进行 转换 : 

3*x*x-4*x-2*aty 


调用 listVariables 函数 将 产生 如 下 输出 : 








p 4 
11. 在 数学 中 ， 一些 应 用 场合 需要 你 将 公式 中 所 有 实例 变量 使 用 另外 的 变量 进行 蔡 换 。 以 exp .nh 用 户 
的 身份 ， 编 写 函数 : 


12. 


13. 


15. 
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Expression *changeVariable (Expression *exp, 

string oldName, 

string newName) ; 
它 返 回 一 个 与 exp 相同 的 表达 式 ， 但 是 其 中 所 有 oldName 标识 符 被 替换 为 newName。 举 例 来 
Bi, WR exp 是 如 下 表达 式 : 


N, 
2 + 
i 
x z 
调用 以 下 语句 : 
Expression *newExp = changeVariable(exp, "x", "y"); 
将 为 newExp 赋值 如 下 表达 式 : 
Ne 
ÁN 
2 * 
ÁN 


当 你 实现 该 函数 时 ， 你 必须 做 到 新 的 表达 式 树 与 原来 的 树 没有 公共 节点 。 如 果 节 点 是 共享 的 ， 将 
不 能 随时 调用 delete 操作 来 释放 堆 内 存 ， 因 为 这 么 做 将 使 得 另 一 棵 树 的 节点 被 释放 。 

在 19.3 节 介 绍 的 表达 式 解释 器 中 ， 每 一 个 操作 符 都 是 一 个 二 元 操作 符 ， 需 要 作用 于 两 个 操作 数 。 
大 多 数 编程 语言 允许 使 用 只 传人 一 个 操作 数 的 一 元 操作 符 。 改 造 解释 器 使 得 解释 器 支持 一 元 操 
作 符 -。 

编写 函数 : 


bool expMatch(Expression *el, Expression *e2); 


该 函数 在 el 与 e2 这 两 个 表达 式 拥有 相同 结构 、 相 同 操作 符 、 相 同 常量 和 相同 标识 符 名 ， 并 且 都 ， 


拥有 相同 顺序 的 情况 下 ， 返 回 true。 如 果 表达 式 树 中 有 任何 一 个 层级 是 不 相同 的 ， 函 数 将 返回 


false, 


. 编写 一 个 从 用 户 处 读 取 具 有 标准 数学 输入 形式 表达 式 的 程序 ， 该 程序 读 人 表达 式 后 使 用 逆 波 兰 式 形 


式 输出 输入 的 表达 式 ， 在 逆 波 兰 式 表 达 式 中 ， 操 作 符 在 其 应 用 的 操作 数 之 后 显示 ( 逆 波 兰 式 表 达 式 
在 第 4 章 的 运算 应 用 中 进行 了 介绍 )。 你 的 程序 必须 可 以 实现 下 面 这 一 执行 实例 : 





"al, 


在 转换 一 个 表达 式 之 后 ， 商 业 编译 器 通常 要 找到 一 个 简化 表达 式 的 方法 以 提高 表达 式 的 计算 效率 。 
这 一 过 程 是 通用 技术 里 的 一 个 部 分 ， 称 为 优化 (oprimization)， 编 译 器 在 这 一 阶段 将 尽量 使 生成 的 
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代码 效率 更 高 。 优 化 过 程 中 最 常用 的 一 个 技术 就 是 常数 合并 (constant folding)， 常 数 合 并 将 检查 组 
成 整个 表达 式 的 子 表达 式 ， 并 使 用 该 子 表达 式 的 计算 结果 代替 表达 式 本 身 。 例 如 ， 如 果 编 译 器 处 
理 以 下 表达 式 : 

days = 24 * 60 * 60 * sec 


在 程序 运行 时 ， 我 们 不 需要 执行 计算 前 面 两 个 乘法 的 代码 。 子 表达 式 24*60*60 的 值 是 一 个 常量 ， 
并 且 可 以 在 编译 期 生成 实际 代码 之 前 使 用 数值 (86400) 进行 代替 。 

编写 函数 foldconstants (exp), 该 函数 获取 一 个 表达 式 指 针 ， 并 且 返 回 男 一 个 指向 全 新 
表达 式 的 指针 ， 在 新 表达 式 中 ， 所 有 由 常量 组 成 的 表达 式 已 经 被 计算 结果 代替 。 


. 将 表达 式 由 内 部 表示 形式 转换 为 文本 模式 这 一 过 程 被 称 为 反 解析 (unparsing)。 编 写 一 个 unparse 


(exp) 函数 ， 该 函数 将 表达 式 exp 用 标准 数学 形式 显示 在 屏幕 上 。 同 时 ， 只 有 在 需要 考虑 优先 级 
的 情况 下 才 会 给 表达 式 加 上 括号 。 因 此 以 下 表达 式 树 : 


P 
2. 
P 


y 


应 该 被 反 解析 为 : 


y=3* (x * 1) 


. 虽然 本 章 介 绍 的 解释 器 程序 比 一 完整 个 编译 器 要 更 容易 实现 ， 但 是 我 们 还 是 必须 通过 定义 一 个 简单 


地 称 为 堆栈 机 (stack machine) 的 电脑 系统 来 了 解 编译 器 的 工作 细节 。 一 个 堆栈 机 在 内 部 栈 中 进 
行 操作 ， 该 栈 由 硬件 进行 维护 ， 并 且 其 运行 特征 与 第 5 章 中 的 逆 波 兰 式 计算 相 类 似 。 根 据 以 下 
图 19-19 中 的 指令 ， 假 设 我 们 要 使 用 堆栈 机 来 解决 这 一 问题 。 


[nop gn | HAMA 


这 些 指令 弹出 栈 顶 的 两 个 元 素 并 对 这 两 个 值 进 行 特定 的 运算 ， 将 运算 结果 再 压 回 到 栈 中 。 
其 中 ， 第 一 个 弹出 的 值 为 右 操作 数 ， 后 弹出 的 值 为 左 操作 数 





图 19-19 堆栈 机 中 实现 的 指令 
首先 编写 一 个 函数 : 


void compile(istream & infile, ostream & outfile); 


该 函数 从 infile 中 读 取 表达 式 ， 并 向 outfile 中 写 和 人 一 系列 堆栈 机 指令 ， 这些 指令 可 以 执行 
与 输入 表达 式 相同 的 表达 式 运 算 操作 ， 并 且 显 示 到 输出 结果 中 。 例 如 ， 如 果 infile 文件 中 内 容 
如 下 : 


7 
5 
x 


x* nw 


x 
Y 
2 +3 *y 


调用 compile (infile, outfile) 将 向 文件 写 人 如 下 代码 : 
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18. EvaluationContext 类 中 的 符号 表 与 标识 符 名 称 代表 的 值 相 对 应 。 在 实际 的 编译 器 中 ， 符 
号 表 映 射 到 标识 符 名 所 代表 的 地 址 上 ， 该 地 址 存 有 相应 的 值 。 你 可 以 模仿 这 一 过 程 ， 改 造 
EvaluationContext 类 ,使 得 该 类 提供 以 下 函数 : 
int getAddress (string name); 


int getValue(int addr); 
void setValue(int addr, int value); 


第 一 个 函数 将 在 内 部 符号 表 中 查找 标识 符 名 ， 返 回 一 个 包含 变量 值 的 数字 地 址 。 如 果 标 识 符 名 在 
之 前 没有 出 现 过 ，getAddress 应 该 生成 一 个 新 的 地 址 ， 并 且 返 回 该 地 址 的 值 。getValue 方法 
和 setValue 方法 获取 地 址 值 而 不 是 地 址 名 称 ， 但 是 其 执行 结果 应 该 与 获取 地 址 名 时 的 执行 结果 
—R. 
请 将 这 一 设计 运用 到 19.3 节 中 的 解释 器 上 。 
19. 从 习题 18 中 基于 地 址 实现 的 解释 器 开始 ， 加 入 一 元 操作 符 & 和 * ， 用 于 操作 指针 类 型 值 。 在 增加 
这 些 操作 符 之 后 ， 你 的 解释 器 必须 能 够 生成 以 下 运行 实例 : 


FE PT C eme 





UT 





地 址 值 的 生成 是 任意 的 ， 取 决 于 你 的 getAddress 函数 实现 中 如 何 赋值 一 个 新 地 址 。 在 该 实现 
H, RIER 4 位 整数 作为 地 址 ， 使 得 这 些 值 更 容易 辨认 。 

20. 用 树 结构 来 表示 表达 式 使 复杂 数学 运算 成 为 可 能 ， 我 们 在 运算 中 将 复杂 数学 表达 式 转换 为 树 形 结 
构 。 例 如 ， 编 写 一 个 函数 ， 根 据 表达 式 导 数 运算 规则 对 表达 式 进行 求 导 。 最 常用 的 数学 表达 式 求 
导 规 则 展示 在 图 19-20 中 。 
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其 中 : 
x 是 用 于 求 导 基准 的 变量 
c 是 一 个 常量 或 变量 ， 它 与 x 无 关 


u 和 v 是 任意 表达 式 


u^ 





图 19-20 ”导数 标准 公式 


编写 一 个 应 用 了 图 -19-20 中 规则 的 递归 函数 differentiate (exp,var), 该 函数 将 计算 


594 
x 
ex 
(u*vy-u-v 
(u-v = = 
(uv) = uv + vu’ 
" y - 
(ulv) = m 
885 
表达 式 exp 的 var MFR. 


differentiate 函数 的 返回 值 是 一 个 可 以 用 于 任何 其 他 地 方 的 


Expression 指针 。 例 如 ， 你 可 以 计算 该 表达 式 ， 或 者 将 其 传人 differentiate 函数 中 进行 二 


次 求 导 。 


21. 扩展 解释 器 ， 使 得 解释 器 可 以 应 用 于 BASIC 语言 的 简单 语句 处 理 ， 该 语言 在 20 世纪 60 年 代 由 约 


翰 ' 科 姆 尼 (John Kemeny) 


和 托马斯 . FER (Thomas Kurtz) 开发 。 在 BASIC 语言 中 ， 程 序 的 每 


一 行 以 一 个 数字 开头 ， 该 数字 决定 了 程序 语句 的 执行 顺序 。 每 一 行 都 包括 了 图 19-21 中 展示 的 语 
句 。 其 中 使 用 RUN 命令 来 代替 使 程序 运行 的 语句 ， 程 序 将 从 数字 最 小 的 行 开始 ， 一 直 运 行 到 END 
语句 ， 该 语句 标志 着 程序 的 结束 。 例 如 ， 以 下 例子 将 输出 500 以 内 2 的 乘 方 。 











10 LET 





30 LET 





PRINT exp 


IF e, op e; THEN line 


n 
20 PRINT 
n 


do IF a 50D cms de 





如 果 运 算 的 值 为 真 ， 将 控制 权 移交 到 程序 指定 的 行 数 。 其 中 操作 符 可 以 为 任何 
标准 关系 操作 符 


标记 程序 的 结束 


19-21 BASIC 语言 中 的 简单 语句 
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Programming Abstractions in C++ 
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何 物 需要 迭代 ? 
一 威廉 ， 莎士比亚 ,《 奥 赛 罗 》，1603 887 


集合 中 最 重要 的 一 个 操作 就 是 迭代 访问 它 的 每 一 个 元 素 。 现 在 ,你 已 经 使 用 过 基于 范围 
的 for 循环 来 实现 该 目的 ， 它 使 代码 十 分 简明 ， 可 读 性 强 。 然 而 这 个 特性 是 C++ 2011 标准 
新 增 的 。 在 介绍 for 循环 扩展 版 本 之 前 ， 我 们 可 以 使 用 先 代 器 Citerator) 来 遍历 访问 C++ 
集合 中 的 每 一 个 元 素 ， 该 迭代 器 指向 一 个 集合 中 的 一 个 特定 元 素 ， 并 且 每 次 可 以 通过 单 步 递 
进 的 方式 来 访问 其 他 元 素 。 

由 于 C++ 的 大 部 分 历史 原因 ， 基 于 范围 的 for 循环 是 无 法 使 用 的 ， 和 迭代 器 在 以 前 的 代 
码 中 十 分 普遍 。 此 外 ， 大 部 分 用 来 处 理 集合 类 有 用 的 库 函 数 使 用 迭代 器 来 指定 该 函数 运用 在 
一 个 集合 类 的 某 一 具体 部 分 。 基 于 这 些 原因 ， 为 了 使 用 C++ 高 效 的 编程 ， 理 解 迭 代 器 的 使 
用 是 很 有 必要 的 。 然 而 ， 理 解 底层 的 实现 细节 并 不 重要 。 因 此 ， 这 章 集中 讨论 迭代 器 如 何 解 
决 用户 的 问题 ， 以 及 在 应 用 中 如 何 使 用 它们 。 本 章 的 最 后 一 节 介绍 实现 的 细节 ， 它 只 与 你 需 
要 执行 并 支持 迭代 器 的 类 有 关 。 

在 关于 迭代 器 是 以 用 户 为 本 还 是 以 实现 为 本 的 讨论 中 ， 本 章 介绍 了 一 种 不 同 的 模型 ， 该 
模型 为 一 个 集合 类 中 的 每 一 个 元 素 运 用 一 种 操作 。 为 了 代替 使 用 迭代 器 或 基于 范围 的 for 
循环 去 遍历 其 中 的 每 一 个 元 素 ， 一 种 可 选 的 策略 是 允许 用 户 依次 地 对 集合 类 中 的 每 个 元 素 运 
用 一 个 函数 。 以 这 种 方式 使 用 的 函数 被 称 为 映射 函数 (mapping function), WRAY PBA 
代 器 方便 ， 因 此 很 少 使 用 。 然 而 它们 更 易于 实现 。 此 外 ， 了 映射 函数 对 于 计算 机 科学 《特别 是 
随 着 大 规模 并 行 应 用 程序 的 开发 ) 愈加 重要 。 


20.1 使 用 和 迭代 器 


在 STL 和 Stanford 类 库 中 ， 每 一 个 集合 类 导出 了 一 个 名 为 iterator 的 类 ， 这 个 类 为 
该 集合 类 提供 了 一 个 迁 代 器 。 从 语法 上 讲 ，C++ 的 迭代 器 类 似 于 指针 。 例 如 ， 和 迭代 器 使 用 * 
操作 符 获 取 当 前 元 素 的 值 ，++ 操作 符 让 迭代 器 指向 下 一 个 元 素 。 如 果 你 对 这 些 操作 感觉 生 
Bi, UEM OJ— BAR 11 章 ， 它 向 你 介绍 了 使 用 迭代 器 所 需要 的 惯用 模式 。 


20.1.1 简单 的 迭代 器 例子 


在 进行 iterator 类 及 其 操作 的 详细 讨论 之 前 ， 考 虑 一 个 使 用 迭代 器 来 单 步 访问 集合 
类 中 各 元 素 的 简单 例子 是 很 有 用 的 。 第 5 章 介 绍 的 第 一 个 基于 范围 的 for 循环 的 例子 使 用 [888] 
了 以 下 代码 ， 它 列 出 了 存储 在 EnglishWords.dat 字典 中 两 个 字母 构成 的 单词 : 
aere X one ("EnglishWords.dat"); 
for (string word : english) ( 
if (word.length() == 2) ( 
cout «« word «« endl; 
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} 
} 
return 0; 


} 
EHTE, TwoLetterWords 程序 就 如 下 所 示 : 


int main() ( 
Lexicon english("EnglishWords.dat"); 
for (Lexicon::iterator it = english.begin(); 
it !- english.end(); it++ 
string word - *it; 
if (word.length() -- 2) ( 
cout << word «« endl; 
} 
} 
return 0; 


} 


这 个 实现 的 核心 是 用 来 声明 循环 索引 变量 it 的 iterator RM, HRB it MA english 
字典 的 开头 开始 遍历 ， 一 次 一 个 单词 ， 直 至 到 达 终 点 。 

不 像 你 之 前 见 到 的 大 部 分 类 型 ，iterator 并 不 是 一 个 独立 的 类 型 ， 它 是 集合 类 
的 一 部 分 而 被 导出 的 一 个 类 型 。 用 这 种 方式 定义 的 类 型 称 为 赚 套 类 型 (nested type). 4$ 
个 集合 类 都 有 自己 定义 的 iterator 版 本 作为 一 个 能 套 类 型 。 因 为 这 个 iterator 名 
字 并 不 是 唯一 标识 它 所 属 的 集合 类 ， 用 户 必 须 使 用 完整 的 名 称 。 因 此 ，Lexicon 类 
的 迭代 器 命名 为 Lexicon::iterator。 同 样 ，Vvector<int> 类 的 迭代 器 命名 为 
Vector«int»::iteratore 

除了 导出 iterator 类 来 指定 该 集合 类 之 外 ， 每 一 个 集合 类 导出 两 个 返回 迭代 值 的 方 
法 。begin 方法 返回 一 个 初始 化 的 迭代 器 ， 以 便 它 指向 集合 类 对 象 的 第 一 个 元 素 。end 方 
法 返回 一 个 指向 其 对 象 的 最 后 一 个 元 素 后 面 不 存在 的 元 素 的 迭代 器 。 因 此 begin 和 ena 3s 

代 器 描述 了 一 个 范围 ， 这 个 范围 让 人 联想 到 第 2 章 介绍 过 的 半 开 区 间 。 集 合 类 中 的 元 案 从 

begin 指向 的 元 素 开始 ， 然 后 递 进 ,但 是 不 包括 end 指向 的 元 素 。 

在 C++ 中 ， 用 于 迭代 器 的 操作 符 和 用 于 指针 的 操作 符 是 相同 的 。 给 定 一 个 迭代 器 ， 你 
可 以 通过 使 用 * 操作 符 来 查找 它 指向 的 值 ， 正 如 你 用 一 个 指针 解析 它 所 指 的 对 象 内 容 一 样 。 
因此 ， 语 名 


string word - *it; 


初始 化 变量 word， 使 它 包含 迭代 器 当前 位 置 在 字典 中 的 字符 串 。 
for 循环 末尾 的 表达 式 ito 使 迭代 器 递 进 ， 以 使 它 指向 字典 中 的 下 一 个 元 素 。 同 样 对 
于 指针 来 说 ， 我 们 可 以 使 用 ++ 操作 符 来 增加 指针 值 ， 从 而 使 其 指向 数组 的 下 一 个 元 素 。 
迭代 器 支持 C++ 中 指针 实现 的 多 种 操作 。 例 如 ， 一 些 程序 员 可 能 选择 使 用 下 面 的 表达 
方式 〈 尽 管 从 习惯 上 来 看 这 样 做 不 是 一 个 较 好 的 选择 ) 将 自 增 和 解析 操作 结合 : 


string word = *it++; 
然后 在 for 循环 的 初始 位 置 省 略 自 增 操 作 。 另 一 些 程序 员 可 能 在 if 测试 语句 和 输出 语句 
中 ， 通 过 解析 迭代 器 的 值 来 消除 局 部 变量 word, W FAR: 
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for (Lexicon::iterator it = english.begin() ; 
it !- english.end(); it++) { 
if (it->length() == 2) { 
cout << *it << endl; 
) 
} 
与 指针 一 样 ， 常 用 模式 *it++ 意味 着 自 增 指针 ， 但 是 在 自 增 操作 发 生 之 前 解析 当前 的 值 。 
同样 地 ， 表 达 式 it->length() 是 (*it).length() 的 简化 ， 对 字典 中 当前 的 元 素 调用 
length 方法 。 


20.1.2 和 迭代 器 的 层次 结构 
在 最 低 限 度 下 ，C++ 中 的 每 一 个 迭代 器 都 支持 上 节 所 描述 的 * 和 ++ 操作 ， 以 及 相关 的 
== 和 != 操作 。 这 些 操作 符 对 于 实现 基于 范围 的 for 循环 很 有 用 ， 每 次 可 以 在 集合 中 遍历 [890 
一 个 元 素 。 然 而 ， 一 些 集合 类 定义 的 迭代 器 支持 更 多 的 通用 操作 。 
图 20-1 展示 的 是 迭代 咒 在 不 同类 层次 上 所 支持 的 扩展 操作 ， 它 们 遵循 继承 层次 。 和 迭代 
器 支持 的 最 基本 的 操作 为 InputIterator， 它 允许 读 值 ， 以 及 outputIterator, ER 
许 给 解析 的 迭代 器 赋 一 个 新 值 。ForwardIterator 类 结合 了 这 些 功 能 ， 因 此 支持 读 值 和 
写 值 。BidirectionIterator 模型 增加 了 -- 操作 符 ， 使 得 向 前 或 向 后 移动 迭代 器 成 为 
可 能 。RandomAccessIterator 是 非常 通用 的 模式 ， 它 既 包 含 了 将 迭代 器 向 前 迭代 nm 个 
元 素 ， 也 包括 了 全 部 的 关系 操作 符 。 
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it +n it, < it, 
it = ü it, <= it, 


it += n it, > it, 
it -= n it, >= it, 
it, - it, 


图 20-1 C++ 和 迭代 器 类 层次 


Lexicon 类 只 支持 InputIterator 层 的 功能 ， 这 意味 着 在 不 将 其 放 人 一 些 更 通用 
的 结构 时 ， 从 Lexicon 的 最 后 开始 ， 和 迭代 访问 该 字典 中 的 所 有 单词 是 难以 实现 的 。 相 比 之 
F, Vector 类 的 迭代 器 是 RandomAccessIterator。 因 此 ,使 用 下 面 的 代码 从 矢量 对 
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Av 的 最 后 开始 ， 和 迭代 访 问 v 中 的 元 素 是 可 行 的 ， 该 代码 在 控制 台 上 逆序 输出 元 素 : 


Vector<int>::iterator it = v.end(); 
while (it != v.begin()) { 

cout << *--it << endl; 
} 


在 这 段 代码 中 ， 在 对 和 迭代 器 解析 引用 之 前 自 减 迭 代 器 是 很 重要 的 。it 的 初始 值 指向 矢量 末 
尾 不 存在 的 元 素 。 自 减 操作 符 将 迭代 器 向 前 移动 一 位 ， 因 此 指向 最 后 一 个 元 素 。 类 似 地 ， 你 
可 以 使 用 下 面 的 代码 输出 v 中 的 任 一 元 素 : 


for (Vector<int>::iterator it = v.begin(); 
it « v.end(); it += 2) { 
cout «« *it «« endl; 
) 


和 那些 尝试 充分 使 用 指针 操作 的 代码 一 样 ， 以 这 种 不 常见 的 方式 使 用 迭代 器 最 终 经 常会 
使 程序 难以 维护 。 指 定 迭 代 器 的 最 好 方法 是 无 论 何 时 都 使 用 基于 范围 的 for 循环 ， 因 为 这 
样 做 能 完全 地 隐藏 迭代 操作 。 

然而 ， 和 迭代 器 在 C++ 中 还 因 其 他 原因 显得 非常 重要 。 标 准 模 板 库 中 的 很 多 函数 和 方法 
都 使 用 迭代 器 作为 参数 ,或 者 返回 结果 为 一 个 迭代 器 。20.4 节 将 会 更 细致 地 探索 这 些 机 制 。 
然而 ， 在 此 之 前 ， 它 帮助 引用 一 个 更 通用 的 编程 概念 ， 这 一 概念 也 集成 进 STL 的 设计 中 ， 
即 能 够 使 用 函数 作为 数据 结构 的 一 部 分 。 


20.2 ”使 用 函数 作为 数据 值 


直到 现在 ， 你 一 直 认 为 应 该 将 函数 和 数据 结构 的 概念 保持 相对 独立 。 隐 数 提供 了 表示 
一 种 算法 的 方式 ;数据 结构 允许 你 组 织 用 于 算法 的 信息 。 函 数 是 算法 结构 的 一 部 分 ， 而 不 是 
数据 结构 的 一 部 分 。 然 而 ， 能 够 将 函数 作为 数据 值 使 用 ， 常 常会 使 设计 有 效 的 接口 变 得 很 容 
易 ， 因 为 这 种 机 制 允 许 用 户 像 指定 数据 一 样 指定 操作 。 


20.2.1 函数 指针 


在 早期 计算 中 ， 程 序 是 以 代码 和 数据 完全 分 开 的 形式 表示 的 。 典 型 地 ， 代 码 被 记录 在 打 
孔 纸 带 上 ， 接 着 输入 到 机 器 中 ， 然 后 依次 执行 指令 。 如 果 你 需要 改变 这 个 程序 ， 就 必须 重 打 
一 条 新 的 纸 带 。 现 代 计 算 机 的 一 个 重要 特征 就 是 同一 内 存 既 被 用 来 存储 数据 值 ， 也 被 用 来 存 
储 硬件 执行 的 机 器 指令 。 将 指令 存储 在 内 存 地 址 中 作为 数据 值 使 用 的 这 种 技术 被 称 为 冯 “' 诺 
伊 曼 体 系 结构 ( von Neumann architecture)。 尽 管 现 在 计算 机 历史 学 家 认为 汉 : 诺 伊 曼 不 是 创 
造 这 个 想法 的 人 ， 但 他 还 是 第 一 个 实现 这 种 技术 的 人 ， 因 此 这 个 概念 体系 被 冠 以 他 的 名 字 。 

15 - 诺 伊 曼 体系 结构 的 一 个 重要 理念 就 是 程序 中 每 一 个 机 器 指令 在 内 存 中 都 有 一 个 地 
址 。 这 个 事实 使 得 创建 一 个 指向 函数 的 指针 (pointer to a function) 成 为 可 能 ， 函 数 指针 即 
为 函数 的 第 一 条 指令 的 地 址 。 大 多 数 现代 编程 语言 使 用 指向 函数 的 指针 并 对 程序 员 隐 藏 其 细 
节 。 与 这 些 语言 相反 ，C++ 允许 程序 员 声 明 指 向 函数 的 指针 ， 然 后 在 应 用 中 使 用 这 些 函 数 指 
针 作 为 数据 值 。 


20.2.2 简单 的 画图 应 用 
研究 如 何在 C++ 语法 中 加 入 指向 函数 的 指针 细节 之 前 ， 思 考 一 个 例子 来 展示 这 种 技术 
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是 如 何 用 于 实践 的 会 很 有 帮助 。 最 早 解释 该 技术 的 例子 是 为 用 户 指定 的 函数 产生 一 个 函数 图 
形 的 问题 。 例 如 ,假设 你 想 要 编写 一 个 绘制 函数 (x) 在 给 定 范围 x< 上 的 函数 值 的 图 形 。 例 
如 ， 如 果 f 是 正弦 函数 ,程序 应 该 产生 如 下 图 所 示 的 运行 结果 : 





这 个 图 形 化 输出 只 是 展示 了 图 的 形状 ， 并 没有 指明 任何 沿 着 x PURI y 轴 的 单位 。 在 该 图 中 ， 
x 的 值 从 一 27 变化 到 2" ， iiy 的 值 从 一 1 变 到 1。 用 户 调用 plot 也 数 需要 将 范围 作为 参 
数 ， 它 意味 着 假定 给 常量 PI 合适 的 定义 ， 这 个 调用 能 产生 如 下 所 示 的 输出 : 


plot(gw, sin, -2 * PI, 2 * PI, -1, 1); 


在 这 里 ， 有 意思 的 参数 就 是 图 像 化 窗口 之 后 的 参数 ， 也 就 是 你 想 要 绘制 的 函数 的 名 字 。 
在 这 个 例子 中 ， 函 数 是 来 自 <cmath> 库 中 的 三 角 函 数 sin. 

然而 ， 如 果 plot 以 一 种 更 通用 的 方式 来 设计 的 话 ， 应 该 可 以 通过 改变 第 二 个 参数 来 绘 
制 一 个 不 同 的 函数 。 例 如 ， 函 数 调用 : 


plot(gw, sqrt, 0, 4, 0, 2); 


应 该 绘制 出 sqrt 函数 的 图 形 ， 该 函数 图 形 在 x 轴 的 0 到 4 区 间 内 ， 以 及 y 轴 的 0 到 2 区 间 
内 ， 如 下 图 所 示 : 








同时 ， 传 递 给 plot 的 函数 不 能 是 任意 的 已 有 函数 。 例 如 ， 使 用 字符 串 函 数 就 没有 任 
何 意义 ， 因 为 在 x 一 y 坐标 系 中 的 图 形 只 对 数字 函数 有 意义 。 此 外 ， 若 传递 给 plot 的 函数 
车 是 带 有 几 个 参数 的 数值 函数 也 是 没有 意义 的 。 函 数 只 以 一 个 实数 作为 参数 (可 能 是 一 个 
double 类 型 )， 并 返回 一 个 实数 才 有 意义 。 因 此 ， 你 可 以 说 函数 plot 的 第 二 个 参数 必须 
在 能 够 将 一 个 double 类 型 映射 为 男 一 个 double 类 型 的 这 类 函数 中 选择 。 

此 外 ， 这 个 参数 必须 是 某 种 C++ 类 型 的 一 个 数据 值 。 尽 管 函 数 本 身 不 是 数据 值 ， 而 是 
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指向 函数 的 指针 。plot 的 第 二 个 变量 因此 是 一 个 指向 函数 的 指针 ， 该 函数 以 double 类 型 
作为 它 的 参数 ， 并 返回 一 个 double 类 型 值 。 用 户 提供 了 plot 函数 的 地 址 。plot 的 实现 
中 接着 调用 用 户 提供 的 函数 来 计算 图 中 每 一 个 新 的 y 值 。 由 于 plot 函数 的 实现 与 其 调用 者 
分 离 ， 因 此 用 户 提供 的 这 个 函数 被 称 为 回调 函数 (call function). 


20.2.3 声明 函数 指针 

在 编写 plot 函数 之 前 ， 你 唯一 需要 学 习 的 语言 新 特征 是 其 第 二 个 参数 的 声明 语法 ， 你 
已 经 知道 它 是 一 个 指向 参数 值 和 返回 值 都 是 double 类 型 的 函数 指针 。 当 你 第 一 次 遇 到 它 
时 ， 即 使 它 跟 C++ 其 他 地 方 使 用 的 声明 模型 一 样 ， 声 明 一 个 函数 指针 的 语法 看 起 来 也 很 令 
人 困惑 。 理 解 函 数 指针 声明 的 关键 在 于 分 辨 一 个 变量 的 声明 是 反映 了 它 的 用 法 而 不 是 它 的 结 
Ho K 20-1 的 例子 阐述 了 这 个 原则 。 

表 20-1 EE C++ 的 声明 
double x; 在 这 个 简单 声明 中 ,变量 x 是 double 类 型 


这 个 声明 指出 当 list 后 面 跟着 一 个 被 方 括号 包围 的 数字 时 ， 其 结果 
是 double 类 型 。 变 量 list 因此 是 一 个 double 类 型 的 数组 


表达 式 *dp 是 double 类 型 ， 这 意味 着 dp 必须 是 一 个 指向 double 


double list[n]; 


double *dp; 类 型 的 指针 
aci. aS 表达 式 **dpp 是 double 类 型 ， 这 意味 着 dpp 必 须 是 一 个 指向 
PP: double 类 型 指针 的 指针 
WR £ (exp) 以 一 个 double 类 型 的 参数 出 现 ， 那 么 函数 的 返回 结果 
double f (double); 为 double 类 型 。 因 此 ， 这 个 声明 是 以 一 个 double 类 型 作为 参数 ， 并 


返回 一 个 double 类 型 的 结果 的 函数 f 的 原型 
如 果 表 达 式 *g (exp) 出 现在 代码 中 ,那么 其 结果 为 double 类 型 。 因 


double *g (double); 为 圆 括号 的 优先 级 高 于 星 号 ， 该 声明 是 返回 一 个 指向 double 类 型 指针 的 
函数 g 的 原型 

与 上 一 个 声明 相反 ， 解 析 引 用 操作 在 函数 调用 之 前 就 被 应 用 。 因 此 变 

double (*fn) (double); Ht fn 是 一 个 返回 值 为 double 类 型 函数 的 指针 。 由 于 C++ 对 函数 指针 


自动 解析 引用 ， 因 此 调用 该 函数 通常 被 写 为 fn (exp) 


K 20-1 的 最 后 一 行 声 明了 一 个 指向 函数 的 指针 fn， 它 指向 一 个 以 double 类 型 为 参数 
并 返回 一 个 double 类 型 的 函数 ， 它 也 是 完成 plot 函数 原型 所 需要 的 参数 ， 如 下 所 示 : 


void plot (GWindow & gw, double (*fn) (double), 
double minX, double maxX, 
double minY, double maxY); 


这 些 参数 分 别 是 图 形 化 窗口 、 被 绘制 的 函数 以 及 图 形 在 x A y 轴 方 向 上 的 界限 。 


20.2.4 LW plot 函数 


一 旦 你 定义 了 函数 原型 ， 就 可 以 使 用 第 2 章 中 介绍 的 图 形 库 编 写 一 个 如 图 20-2 所 示 
的 简单 plot 实现 。 这 个 实现 对 图 形 窗口 中 的 每 一 个 像素 循环 遍历 ， 将 每 一 个 在 minx 和 
maxX 间隔 位 置 上 的 x 坐标 转变 为 相应 的 y 坐标。 

例如 ， 在 窗口 的 中 间 点 对 应 着 minx Al maxx 的 中 间 值 。 程 序 接着 调用 函数 fn 去 计算 
y 的 值 ， 如 下 所 示 : 


double y = fn(x); 
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* Function: plot 
* Usage: plot(gw, fn, minX, maxX, minY, maxY); 
* 


* Plots the specified function (which must map one double to another 
* double) on the screen. The remaining arguments indicate the range 
* of values in the x and y directions, respectively. 


*/ 


template «typename FunctionClass> 
void plot(GWindow & gw, FunctionClass fn, 
double minX, double maxX, 
double minY, double maxY) ( 
double width - gw.getWidth(); 
double height - gw.getHeight(); 
double nSteps - int(width); 
double dx - (maxX — minX) / nSteps; 
double sxO = 0; 
double sy0 = height - (fn(minX) - minY) / (maxY 一 minY) * height; 
for (int i = 1; i < nSteps; i++) ( 
double x = minX + i * dx 
double y = fn(x); 
double sxl = (x — minX) / (maxX — minX) * width 
double syl = height - (y - minY) / (maxY 一 mint! * height; 
gw.drawLine(sx0, syO, sxl, syl); 
sxO = sxl; 
sy0 = syl; 





图 20-2 plot 函数 的 实现 


最 后 一 步 通 过 将 y 值 与 minY 和 maxY 进行 比较 ， 从 而 将 y 值 转换 成 屏幕 垂直 方向 上 合 
适 位 置 上 的 像素 点 。 这 个 操作 本 质 上 是 将 x 的 值 进 行 反 转 。 唯 一 的 不 同 是 屏幕 上 的 y 轴 被 转 
化 为 传统 的 笛 卡 尔 积 坐标 平面 ， 它 使 得 从 图 形 视窗 的 高 度 中 减 去 计算 值 十 分 必要 。 

plot 的 执行 开始 于 计算 窗口 左边 的 点 的 坐标 ,将 结果 存储 在 变量 sx0 M syo, M 
中 进一步 正确 地 计算 曲线 中 的 每 一 个 像素 的 坐标 ， 将 这 些 坐 标 存储 在 变量 sx1 和 syl 中 。 
图 形 库 接着 调用 连接 这 些 点 的 一 个 函数 : 


gw.drawLine(sx0, sy0, sxl, syl); 


一 次 循环 将 连接 当前 点 与 它 的 前 驱 点 。 这 个 过 程 与 通过 连接 一 系列 的 线段 有 同样 的 效果 ， 
一 线段 在 x 方向 延长 一 个 像素 。 
图 20-2 中 的 polt 函数 几乎 肯定 太原 始 ， 不 能 应 用 于 实际 的 应 用 程序 。 虽 然 如 此 ， 
展示 了 一 个 如 何 将 函数 看 作 数 据 值 的 有 用 的 示例 ， 这 在 应 用 中 十 分 有 效 。 


20.2.5 映射 函数 


回调 函数 提供 了 另 一 种 策略 来 迭代 集合 类 对 象 中 的 元 素 。 如 果 一 个 类 提供 了 一 种 允许 用 
户 对 一 个 集合 类 对 象 中 的 每 一 个 元 素 调 用 一 个 函数 的 方法 ， 用户 可 以 使 用 这 个 方法 作为 一 个 
可 选 的 方案 去 使 用 一 个 迭代 器 或 是 一 个 基于 范围 的 for 循环 。 人 允许 你 在 集合 类 对 象 的 每 个 
元 素 上 调用 一 个 被 称 为 映射 函数 (mapping function) 的 方法 。 

例如 ，Lexicon 类 中 提供 : 


void mapAll(void (*fn) (string) ) ; 


它 是 以 一 个 形 参 类 型 为 string 类 型 的 函数 指针 作为 其 参数 的 映射 函数 。mapA1ll 的 作用 是 
对 字典 上 每 一 个 单词 调用 特定 方法 ， 使 其 和 Lexicon 迭代 器 处 理 单词 有 着 相同 的 顺序 。 

在 Lexicon 类 中 映射 函数 mapAll 的 存在 使 得 可 以 重新 编写 TwoLetterWords 程 
序 ， 如 下 所 示 : 
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int main() { 
Lexicon english("EnglishWords.dat"); 
english.mapAll(printTwoLetterWords); 
return 0; 


) 
这 里 的 printTwoLetterWords 定义 为 : 


void printTwoLetterWords (string word) ( 
if (word.length() == 2) ( 
cout «« word «« endl; 
} 
} 


mapA11 映射 函数 为 字典 中 的 每 一 个 元 素 调 用 printTwoLetterWwords。 回 调 函 数 检 查 单 
词 的 长 度 是 否 为 两 个 字母 ， 如 果 是 则 输出 。 

在 Stanford 类 库 中 。 每 个 集合 类 都 定义 了 一 个 称 为 mapRl1l 的 映射 函数 ， 它 为 每 一 个 
元 素 调用 一 个 回调 函数 。 当 使 用 基于 范围 的 for 循环 迭代 集合 类 对 象 中 的 元 素 时 ， 调 用 的 
顺序 与 规定 的 顺序 一 致 。 因 此 ， 对 于 一 个 矢量 对 象 而 言 ，mapA1ll 按照 元 素 的 索引 顺序 来 调 
用 回调 函数 ， 对 于 一 个 Grid 对 象 来 说 ，mapAll 按照 行 优先 的 顺序 来 调用 回调 函数 ， 对 于 
一 个 Lexicon 对 象 ， 按 照 字 母 表 的 顺序 来 调用 回调 函数 ， 对 于 一 个 Map 对 象 ， 按 照 键 值 递 
增 的 顺序 来 调用 回调 函数 ， 对 于 一 个 Set 对 象 ， 按 照 元 素 值 递增 的 顺序 来 调用 回调 函数 。 

回调 函数 本 身 通 常 选取 一 个 与 其 参数 的 类 型 相 匹 配 的 类 作为 其 参数 。 这 个 规则 的 一 个 例 
外 就 是 键 - 值 匹配 函数 。 对 于 Map 类 和 HashMap 类 ,回调 函数 需要 两 个 参数 ， 第 一 个 参 
数 代 表 了 一 个 键 ， 另 外 一 个 参数 则 是 相对 应 的 值 。 例 如 ， 你 可 以 使 用 图 20-3 中 的 1istMap 
函数 来 列 出 Map<string,int> 中 所 有 的 键 - 值 对 。 

除了 图 20-2 中 使 用 的 传 值 参 数 以 外 ， 在 Stanford 集合 类 库 中 的 mapAll 函数 也 接受 使 
用 常量 引用 作为 实 参 的 映射 函数 。 因 此 ， 如 果 你 想 要 通过 消除 对 键 的 拷贝 来 增加 代码 的 效 
率 ， 你 可 以 使 用 下 面 1istMapEntry 的 原型 : 


void listMapEntry(const string & key, const int & value); 
这 两 个 函数 类 型 在 C++ 中 有 不 同 的 特征 ，mapAl1 方法 设计 成 可 以 使 用 任意 类 型 的 参数 。 


/* 
* Function: listMap 


* Displays the key-value pairs in the map. The output appears in 
* lexicographic order because the Map class uses the ordering of 
* the key type. 

+f 


void listMap(const Map<string,int> & map) { 
map .mapAll (listMapEntry) ; 
} 


/* 
* Function: listMapEntry 
Usage: listMap(key, value); 


* 
* 


* Prints a single key-value pair. This function is designed to be 
* used as a callback function for the mapAll method in the Map class. 
ad 


void listMapEntry (string key, int value) { 
cout << key << " = " << value << endl; 


) 





Kd 20-3 Map<string,int> 的 功能 方法 列表 
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20.2.6 ”实现 映射 函数 


和 和 迭代 器 相 比 ，20.6 节 中 你 将 有 机 会 进行 更 加 详细 的 思考 ， 映 射 函数 相对 容易 实现 。 
假如 你 使 用 图 14-11 中 基于 矢量 实现 ， 可 以 像 图 20-4 所 示 的 那样 来 实现 mapA11 P 
数 。 只 要 你 定义 了 一 个 递归 的 辅助 方法 ， 对 于 Map 类 来 说 ,实现 mapall 就 相当 容易 了 。 
图 20-5 中 的 代码 对 Map 类 的 实现 做 了 如 下 的 假设 : 像 第 16 章 中 描述 的 那样 ，Map 类 基于 
二 叉 搜 索 树 ， 二 又 搜索 树 的 根 存 储 在 实例 变量 root'P, BsTNode 类 型 包含 了 键 和 值 的 
字段 。 


/* 
* Implementation notes: mapAll 
* 


* This method uses a for loop to call fn cn every element. 


xy 


template «typename ValueType» 
void Vector«ValueType»::mapAll(void (*fn) (ValueType)) const ( 
for (int i = 0; i « count; i++) ( 
fn(array[i]); 


* The exported version of mapAll uses a private helper method that takes 
* the tree as an argument and performs a standard inorder traversal, 

* calling fn(key, value) for every key-value pair 

+y 


template <typename KeyType,typename ValueType> 

void Map«KeyType,ValueType»::mapAll(void (*fn) (KeyType, ValueType)) const { 
mapAll(root, fn); 

) 


template «typename KeyType,typename ValueType> 
void Map«KeyType,ValueType»::mapAll(BSTNode *t, 
void (*fn) (KeyType, ValueType)) const { 
if (t != NULL) { 
mapAll(t->left, fn); 
fn(t-»key, t-»value); 
mapAll(t-»right, fn); 





图 20-5 Map 类 的 mapa11 函数 实现 


20.2.7 ”回调 函数 的 限制 


到 目前 为 止 ， 你 见 过 的 最 简单 形式 的 回调 函数 并 不 难 理解 。 事 实 上 ， 就 程序 结构 而 言 ， 
将 对 一 个 集合 类 对 象 中 的 每 一 个 元 素 进行 遍历 的 任务 与 每 个 循环 中 执行 的 代码 隔离 是 很 有 用 
的 。 然 而 ， 这 个 策略 也 有 严格 的 限制 。 基 本 问题 是 用 户 通常 向 回调 函数 中 所 传递 的 信息 超过 
了 集合 类 所 能 提供 的 参数 。 使 用 回调 函数 使 得 该 过 程 很 困难 。 

为 了 说 明 这 个 问题 ， 同 时 使 TwoLetterWords 问题 一 般 化 ， 以 利于 程序 列 出 一 个 指定 
长 度 的 所 有 单词 ， 而 并 不 一 定 是 两 个 字母 长 度 的 单词 。 更 具体 地 说 ， 这 个 例子 的 目的 是 编写 
— MRR: 


void listWordsOfLengthK(const Lexicon & lex, int k) 
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就 像 函 数 名 所 上 暗示 的 一 样 ， 该 函数 列 出 字典 中 长 度 为 k 的 所 有 单词 。 
如 果 你 使 用 基于 范围 的 for 循环 。 这 个 函数 就 很 容易 编写 : 


void listWordsOfLengthK (const Lexicon & lex, int k) { 
for (string word : lex) ( 
if (word.length() == k) ( 
cout «« word «« endl; 
} 
} 
} 


如 果 你 尝试 使 用 mapAll 函数 来 代替 ,会 遇 到 大 量 问 题 。 回 调 函 数 需 要 获取 k 的 值 ， 
但 是 使 用 mapA1ll 并 没有 明显 的 方式 来 传递 该 信息 。 为 了 确保 回调 函数 有 其 所 需要 的 信 
息 ， 用 户 必 须 以 某 种 方式 向 映射 函数 传递 k， 反 过 来 函数 返回 长 度 与 传递 的 值 相同 的 所 有 
单词 。 在 某 种 程度 上 ， 这 种 情况 使 人 想起 路 易 斯 . 卡 罗 尔 的 《 走 到 镜子 里 》( Through the 
Looking Class) 中 的 红心 皇后 的 观察 ,“ 它 选取 你 可 以 做 的 任何 喜欢 的 事情 ， 保 持 在 同一 
地 点 。” 用 户 需 要 提供 回调 函数 所 需 的 数据 ， 但 是 必须 依赖 于 集合 类 向 用 户 的 回调 函数 
提供 数据 。 幸 运 的 是 ，C++ 提供 了 一 个 解决 这 个 问题 的 合理 方法 ， 我 们 将 在 下 一 节 中 
描述 。 

20.8 用 函数 封装 数据 

函数 指针 在 它们 的 效用 中 被 限制 ， 因 为 它们 无 法 将 函数 与 用 户 提供 的 数据 一 起 提供 。 对 
于 大 多 数 应 用 来 说 ， 你 需要 这 样 一 种 策略 : 它 将 回调 函数 与 用 户 提供 的 数据 封装 成 一 个 单独 
的 单元 。 在 计算 机 科学 中 ， 一 个 函数 与 其 相关 的 数据 的 组 合 被 称 为 闭 包 (closure)。 

一 些 语言 通过 允许 在 函数 定义 的 同时 使 用 函数 内 部 的 变量 来 支持 闭 包 。 但 是 C++ 并 不 
支持 这 种 模式 。 为 了 在 C++ 中 使 用 闭 包 ， 你 需要 自己 创建 必要 的 数据 结构 。 尽 管 这 个 过 程 
比 传递 一 个 简单 的 函数 指针 要 更 为 复杂 ， 但 是 闭 包 还 是 很 重要 的 ， 因 此 ， 花 费 一 些 时 间 理 解 
闭 包 如 何 工 作 是 很 值得 的 。 


20.3.4 使 用 对 象 模拟 闭 包 


在 展现 C++ 程序 员 通 常 创建 闭 包 的 策略 之 前 ， 告 知 C++ 已 经 提供 了 一 种 将 数据 与 代码 
封装 在 一 个 单独 的 实体 里 的 机 制 是 很 值得 的 。 这 个 机 制 称 为 对 象 。 对 于 大 多 数 情 况 而 言 ， 提 
供 的 这 个 封装 恰好 就 是 对 象 。 类 中 的 变量 存储 数据 ， 同 时 方法 提供 代码 。 

为 了 解决 列 出 所 有 个 字母 的 单词 问题 ， 你 需要 定义 一 个 新 的 类 ， 它 将 k 存储 在 一 
个 变量 中 ,但 也 要 提供 一 个 方法 ， 如 果 单 词 的 长 度 与 存储 的 k 值 相 匹 配 ， 该 方法 就 从 字 
典 中 输出 当前 的 单词 。 在 listWordsOfLengthk 的 实现 中 ， 你 可 以 初始 化 创建 一 个 包 
含 期 望 值 k 的 对 象 。 接 下 来 如 果 可 以 将 这 个 对 象 传递 给 映射 函数 ， 你 就 完全 解决 了 这 个 
问题 。 

这 个 解决 办 法 的 唯一 绊脚石 就 是 : 映射 函数 需要 知道 对 于 集合 类 中 的 每 个 值 应 该 调用 的 
方法 名 。 为 了 确保 映射 函数 尽 可 能 地 一 般 化 ， 为 此 定义 一 个 一 致 的 方法 名 是 很 有 意义 的 。 尽 
管 任何 方法 名 都 可 以 ， 但 最 简单 的 策略 是 通过 重 载 operator () 将 对 象 本 身 作 为 方法 ， 这 
个 定义 意味 着 像 函 数 那样 “调用 ”一 个 对 象 。 在 C++ 中 ， 重 载 这 个 操作 符 的 类 叫做 函数 类 
(function class)。 这 些 类 的 实例 称 为 函数 对 象 (function object) 或 函 子 (functor)。 
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20.3.2 ”函数 对 象 的 简单 例子 


为 了 确保 你 理解 函数 对 象 是 如 何 工作 的 ， 用 一 个 与 映射 函数 无 关 的 简单 例子 作为 开始 是 
有 意义 的 。 假 定 你 允许 用 户 创建 并 调用 一 个 类 似 于 函数 对 象 的 对 象 ， 该 对 象 以 一 个 整 型 作为 
参数 ， 并 且 在 加 上 用 户 选 中 的 增 量 后 返回 该 参数 的 值 。 对 于 给 定 的 增 量 ， 这 个 函数 在 C++ 
中 很 容易 编写 。 例 如 ， 函 数 对 其 参数 值 加 1: 


int addl(int x) ( 
return x * 1; 


) 


这 个 例子 的 目的 可 能 与 最 初 的 目的 有 一 点 不 同 。 给 定 一 个 整 型 常量 k， 你 允许 用 户 定义 
函数 : 


int addk(int x) { 
return x * k; 


} 


你 不 可 能 实现 这 种 形式 的 所 有 可 能 的 函数 ， 因 为 这 里 会 有 与 整数 数目 相同 的 函数 。 你 需要 创 
建 一 个 封装 两 个 构件 的 函数 类 : 一 个 变量 记录 的 值 ; 另 一 个 重 载 operator ( ) ， 以 便 该 
操作 符 向 其 参数 增加 存储 的 k 值 。 图 20-6 中 是 AddkFunction 类 的 实现 。 构 造 函 数 创 建 
了 一 个 指定 增 量 的 AddKFunction 的 新 实例 ; HR operator() 给 用 户 提供 的 参数 增加 
了 存储 的 值 。 


/* 
* Class: AddKFunction 
* 


* This class defines a function object that takes a single integer x and 
* computes the value x * k, where k is a constant specified by the client. 
* 

class AddKFunction ( 

public: 

/* 


* Constructor: AddKFunction 
* * VERGE AddKFunction addk = AddKFunction(k); 


* Creates a function object that adds k to its argument. 
my 


AddKFunction(int k) { 
this->k = k; 

) 
/* 
* Operator: 
* 
* Defines the behavior of an AddKFunction cbject when it is called 
* as a function. 


*/ 


int Socr ee x) ( 
return x * 


) 
private: 


int k; /* Instance variable that keeps track of the increment value */ 





Fd 20-6 ”向 参数 中 增加 一 个 常量 的 函数 类 
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下 面 的 主 程序 通过 以 下 操作 提供 了 一 个 对 AddKFunction 类 的 简单 说 明 : 


int main() ( 
AddKFunction addl = AddKFunction(1); 
AddKFunction addi7 = AddKFunction (17) ; 
cout << "add1(100) -> " << add1(100) << endl; 
cout << "add17(25) -> " << add17(25) << endl; 
return 0; 


} 
用 图 20-6 中 AadKFunction HELETE TER, E AAPEA Fi: 








‘addi (100) -> 101 x =| 
add17(25) -> 42 rq 
| "| 
a iaon EELS 


C++ 中 的 函数 对 象 十 分 有 用 ， 对 于 函数 调用 来 说 ， 用 户 可 以 使 用 常规 的 语法 来 调用 它们 。 
例如 ， 在 AddKFunction 类 的 测试 程序 中 ， 局 部 变量 add1 和 add17 Æ AddKFunction 类 
的 不 同 实例 。 然 而 调用 这 些 函 数 对 象 看 起 来 就 像 传统 的 函数 调用 。 表 达 式 addı (100) 调用 
100 次 add1, ， 正 如 它 已 经 被 定义 成 一 个 常见 函数 。 


20.3.3 向 映射 函数 传递 函数 对 象 


使 用 函数 对 象 的 策略 可 以 解决 向 回调 函数 传递 额外 信息 的 问题 。 除 了 函数 指针 之 外 ， 
Stanford 集合 类 中 的 mapA11 函数 (在 标准 模板 库 中 有 与 它 对 应 的 部 分 ) 允许 其 参数 为 一 个 
函数 对 象 ， 只 要 该 函数 对 象 的 operator () 方法 被 重 载 为 与 你 想 要 传递 给 映射 函数 相同 的 
参数 。 例 如 ， 你 可 以 对 一 个 以 一 个 字符 串 作 为 参数 的 函数 对 象 的 Lexicon 类 调用 mapAll 
函数 ， 这 意味 着 对 应 的 函数 类 必须 重 载 方法 : 


void operator() (string); 
图 20-7 定义 了 你 需要 编写 的 listWordsOfLengthk 的 函数 类 ， 它 本 身 只 要 一 行 代码 : 


void listWordsOfLengthK(const Lexicon & lex, int k) { 
lex.mapAll(ListKLetterWords (k) ) ; 
} 


Class: LastKLetterWords 


This class defines a function object that takes a word and prints it 
on the console if it has length k, where k is specified by the client. 


class ListKLetterWords { 
public: 


Constructor: ListKLetterWords 
sage: ListKLetterWords fn = ListKLetterWords(k); 


Creates a function object that prints its argument only if it has 
length k. This function object is used as the argument to the mapAll 
* method in the Lexicon class 





图 20-7 Hog k 个 字母 的 单词 的 函数 类 
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ListKLetterWords (int k) { 
this->k = k; 
} 
/* 


* J Mpexshprs 


* Defines the behavior of a ListKLetterWords object when it is called 
* as a function 
ad 
int operator() (string word) ( 
if (word.length() == k) ( 
cout «« word «« endl; 
) 
) 


private: 
/* Instance variables */ 


int k; /* Length of desired words */ 


* Function: listWordsOfLengthK 
* ae listWords rd ee ie k}; 
* Lists all words in the specified lexicon whose length is equal to k 


&/ 


void listWordsOfLengthK(const Lexicon & lex, int k) ( 
lex.mapA11(ListKLetterWords (k)); 
) 





图 20-7 (4D) 


20.3.4 ”编写 以 函数 作为 参数 的 函数 


从 本 章 之 前 大 量 映 射 函 数 的 实现 中 ， 如 果 你 要 传递 一 个 函数 指针 ， 那 么 在 Lexicon 类 
中 的 mapA11 函数 的 头 部 必须 写成 以 下 形式 : 


void mapAll(void (*fn) (string)); 


这 个 原型 指出 mapA11 的 参数 必须 是 一 个 以 字符 串 作为 参数 并 且 返 回 值 为 空 的 函数 指针 。 

有 趣 的 问题 是 在 这 种 情况 下 应 如 何 声明 一 个 mapRl1l 函数 ， 它 选取 一 个 函数 对 象 来 代 
蔡 函 数 指针 。C++ 提供 了 一 种 简明 的 (即使 有 时 会 复杂 一 些 ) 语法 来 声明 一 个 函数 指针 类 型 。 
如 果 你 想 让 mapAll 以 一 个 函数 对 象 作为 参数 ， 你 应 该 如 何 声明 参数 的 类 型 呢 ? 这 个 问题 
很 难 ， 因 为 一 个 函数 对 象 可 以 是 任意 重 载 函数 调用 操作 符 的 类 的 一 个 实例 。 考 虑 到 你 可 以 在 
任意 类 中 重 载 这 个 操作 符 ， 这 里 似乎 没有 任何 明确 的 方法 声明 它 的 类 型 。 

C++ 通过 使 用 模板 函数 来 实现 任何 以 函数 对 象 作 为 参数 的 函数 的 方式 来 解决 这 个 问题 。 
AE, mapAl1 的 这 个 版 本 的 原型 如 下 所 示 : 


template <typename FunctionClass> 
void mapAll(FunctionClass fn) 


传递 给 mapA11 的 值 可 以 是 任何 类 型 。 当 编译 器 试图 展开 mapAl1 模板 函数 时 ， 如 果 该 类 
型 不 能 重 载 函 数 调用 操作 符 以 至 于 不 能 获得 期 望 的 参数 ， 那 么 编译 器 会 产生 错误 信息 。 


20.4 STL 算法 库 
尽管 迭代 器 对 于 其 最 初 单 步 遍历 集合 类 中 的 元 素 的 目的 相当 有 效 ， 但 是 在 C++ 中 它们 
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更 加 重要 ， 因 为 STL PAY KARST PREC aE A. PU, (BUE Ps BERT — PR a 
象 的 元 素 进行 排序 ， 并 且 充 分 利用 大 量 的 C++ 类 库 的 设计 者 发 明 创建 的 一 个 通用 的 排序 算 
法 库 。 为 此 ，STL 库 中 的 确 包 含 了 一 个 名 为 sort 的 函数 。 然 而 ， 在 第 10 章 阅 读 过 了 大 量 
的 sort 函数 的 实现 之 后 ， 这 个 函数 并 不 像 你 期 望 的 那样 以 一 个 矢量 对 象 作 为 参数 。 库 中 的 
sort 函数 版 本 以 两 个 迭代 器 作为 参数 ， 它 确定 了 你 想 要 排序 的 矢量 对 象 的 范围 。 为 了 对 矢 
量 对 象 v 的 所 有 元 素 排序 ， 需 要 调用 : 
sort(v.begin(), v.end()); 
如 果 你 只 想 对 v 中 的 前 k 个 元 素 排序 ， 你 可 以 调用 : 


sort(v.begin(), v.begin() + k); 


矢量 的 iterator 类 实现 了 RandomAccessIterator 模型 ， 这 意味 着 给 一 个 迭代 器 增加 
k， 将 会 得 到 一 个 指向 第 k 个 元 素 的 迭代 器 。 

STL Æ sort 函数 是 <algorithm> 接口 提供 的 最 有 用 的 函数 之 一 。 尽 管 这 个 
接口 的 范围 相当 广泛 ， 你 可 以 使 用 表 20-2 列 出 的 函数 来 获得 合适 的 范围 。 正 如 你 在 
表 中 第 一 行 看 到 的 使 用 模式 ， 与 sort 函数 的 使 用 方法 相同 ， 这 些 函 数 中 的 大 部 分 都 以 
一 对 迭代 器 作为 甚 参数。 例如， 你 可 以 通过 调用 以 下 语句 随机 打 乱 矢量 对 象 v 中 的 元 素 
顺序 : 


random shuffle(v.begin(), v.end()); 


K 20-2 底部 的 函数 以 函数 作为 参数 从 而 对 一 个 集合 进行 操作 。for_each 函数 推广 了 
映射 函数 的 理念 ， 并 支持 迭代 器 的 任意 集合 类 。 例 如 ， 你 可 以 通过 调用 : 


for each(lex.begin(), lex.end(), printTwoLetterWords) ; 


列 出 字典 lex 中 所 有 两 个 字母 的 单词 。 其 中 ， 这 里 的 printTwoLetterWords 是 20.2.5 
一 节 中 定义 的 回调 函数 。 回 调 函 数 也 可 以 是 一 个 函数 对 象 ， 这 意味 着 你 可 以 通过 调用 : 


for each(lex.begin(), lex.end(), ListKLetterWords(k)); 


列 出 k 个 字母 的 单词 。 
你 可 以 使 用 «algorithm» 接口 中 的 函数 作为 更 复杂 的 操作 的 构件 。 例 如 ， 图 20-8 中 
的 代码 以 <algorithm> 库 中 提供 的 一 些 高 层 函 数 作为 工具 重新 实现 了 第 10 章 中 的 选择 排 
序 算法 。 
/* 


* Function: sort 
* Usage: sort(vec); 
* 


* Sorts the elements in the vector by combining high-level operations 
* from the «algorithm» interface. The selection sort algorithm.is 

* described in Chapter 10. 

z7 


void sort (Vector<int> & vec) { 
for (Vector<int>::iterator lh = vec.begin(); lh != vec.end(); lh++) ( 
Vector<int>::iterator rh = min_element (lh, vec.end()); 
iter swap (lh, rh); 
) 





K 20-8 1H] «algorithm» 库 实现 的 选择 排序 函数 
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表 20-2 «algorithm» 库 中 的 选择 函数 


简单 的 多 态 函 数 










返回 x 和 y 中 的 较 大 者 
返回 x 和 ?了 中 的 较 小 者 


max (x, y) 


swap RUM KREP A y 的 值 或 是 交换 迭代 器 六 和 已 指向 的 值 


iter swap (i, i) 
迭代 范围 内 操作 的 函数 

P 如 果 在 迭代 begin 到 end 的 范围 中 包含 指定 值 value， 则 返 
binary search (begin, end, value) 

T El true 

copy (begin, end, out) 将 指定 迭代 范围 中 的 值 拷贝 给 以 out 开始 的 迭代 器 
count (begin, end, value) 返回 迭代 范围 中 与 指定 的 value 相等 的 值 的 数目 
fill (begin, end, value) 将 指定 迭代 范围 中 的 每 一 个 元 素 置 为 value 


返回 指定 迭代 范围 中 第 一 个 与 value 相等 的 元 素 的 迭代 
器 ， 如 果 不 存在 则 结束 


将 两 个 已 经 有 序 的 子 序 列 合并 成 一 个 以 out 开始 的 完整 的 
有 序 序 列 。inplace_merge 版 本 合并 将 同一 集合 中 的 两 个 
子 序 列 ， 使 用 middle 指明 第 二 个 序列 的 开始 


find (begin, end, value) 


merge (begin, end;, begim, ends, out) 
inplace merge (begin, middle, end) 


min element (begin, end) 
max element (begin, end) 


返回 一 个 指向 迭代 范围 中 最 小 或 最 大 的 元 素 的 迭代 器 


random shuffle (begin, end) 整理 迭代 范围 中 的 元 素 

replace (begin, end, old, new) 将 迭代 范围 中 的 所 有 old 实例 变量 用 new 替换 

reverse (begin, end) 逆序 指定 迭代 范围 中 的 元 素 

sort (begin, end) 将 迭代 范围 中 的 元 素 以 升序 排列 

以 函数 式 作 为 参数 的 函数 ， 该 类 函数 参数 可 以 是 函数 对 象 或 函数 指针 

for each (begin, end,fn) 对 迭代 范围 内 的 每 一 个 元 素 调用 fin 

count if (begin, end, pred) 返回 迭代 范围 内 调用 pred 返回 true 的 值 的 数目 

replace if (begin, end, pred, new) 将 迭代 范围 内 调用 pred 返回 true 的 所 有 值 替换 为 new 
重新 排列 迭代 范围 内 的 元 素 ， 以 至 于 调用 pred 返回 true 

partition (begin, end, pred) x Nome 3X PB ROGE E — AH 8] FR AG 


20.5 C++ 的 函数 式 编程 


与 你 在 第 1 章 所 学 的 一 样 ，C++ 的 设计 人 员 在 C 语言 的 基础 上 加 入 了 面向 对 象 的 特性 。 
鉴于 这 样 的 历史 ， 有 人 就 期 望 C++ 既 包 含 面向 对 象 的 特性 又 包含 底层 的 特征 。 相 比 之 下 ， 
C++ 并 没有 设计 支持 另 一 种 主流 的 范 型 ， 即 函数 式 编 程 (functional programming)， 该 范 型 
有 以 下 的 特征 : 

e 程序 用 紧密 的 函数 调用 来 表示 ， 这 些 函 数 可 以 进行 必要 的 计算 ， 但 是 不 会 执行 任何 

改变 程序 状态 〈 例 如 赋值 ) 的 操作 。 

© 函数 就 是 数据 值 ， 程 序 员 可 以 像 对 待 其 他 的 数据 值 一 样 对 其 进行 操作 。 

尽管 函数 式 编程 不 是 设计 语言 的 一 个 目标 ,事实 上 C++ 包含 的 模板 以 及 函数 对 象 使 得 
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采用 一 种 极其 类 似 于 函数 式 编 程 模 型 的 编程 风格 变 为 可 能 。 


20.5.1 STL 库 <functional> 的 接口 


标准 模板 库 通 过 <functional> 接口 为 函数 式 编程 范 型 提供 了 基本 的 支持 。 如 表 20-3 
所 示 ，<functional> 接口 提供 了 大 量 的 类 以 及 方法 。 与 表 的 第 一 部 分 一 样 ， 类 通常 分 为 
两 种 。 模 板 类 binary function<arg), arg, result» 是 <funtional> 库 中 含有 两 个 参数 
的 函数 的 共同 父 类 ， 其 中 第 一 个 参数 的 类 型 为 arg 类 型 ， 第 二 个 参数 为 arg 类 型 ， 并 且 返 
回 一 个 result 类 型 的 值 。 类 unary function<arg, result» 为 那些 只 含有 一 个 参数 的 函数 
类 扮演 了 同样 的 角色 。 

下 面 三 部 分 中 的 类 扮演 了 C++ 中 为 面向 对 象 所 提供 的 标准 算术 、 关 系 、 人 逻辑 操作 符 
的 角色 。 记 住 这 些 实体 指 的 是 类 而 不 是 对 象 这 一 事实 是 非常 重要 的 。 例 如 ， 如 果 你 想 构 
造 一 个 将 两 个 整数 值 相 加 的 函数 对 象 ， 你 就 需要 调用 plus<int> PMWM, OM 
下 所 示 : 


plus<int>() 
漏 掉 圆 括号 是 一 个 易 犯 的 错误 ， 但 是 这 又 是 在 编译 器 中 极 易 产生 的 隐 式 错误 。 
bindlst 和 bind2nd 函数 可 以 让 我 们 在 一 个 函数 对 象 中 包含 常量 。 例 如 ， 以 下 语句 : 


bind2nd(plus«cint»(), 1) 


X 20-3 «functional» 接口 中 的 部 分 类 和 函数 
ET 


包含 两 个 指定 类 型 的 参数 ， 并 且 返 回 一 个 指定 的 结果 
类 型 的 函数 类 的 父 类 


包含 一 个 指定 类 型 的 参数 ， 并 且 返 回 一 个 指定 的 结果 
类 型 的 函数 类 的 父 类 


binary functioncarg, type, arg;type, result type» 


unary function<argument type, result type» 





实现 算术 操作 符 的 类 


plus<argument type» 
minus<argument type» 
multiples<argument type» 
divides<argument type» 
modulus<argument type» 


negate<argument type» 


实现 比较 操作 的 类 


equal to«argument type» 

not equal to«argument type» 
less«argument type» 

less equal<argument type» 
greater<argument type» 


greater equal«argument type» 


实现 相 加 操作 符 + 的 二 元 函数 类 
实现 相 减 操作 符 - 的 二 元 函数 类 
实现 相 乘 操 作 符 * 的 二 元 函数 类 
实现 相 除 操作 符 / 的 二 元 函数 类 
实现 取 模 操作 符 $ 的 二 元 函数 类 
实现 取 反 操作 符 - 的 一 元 函数 类 


实现 关系 操作 符 == 的 函数 类 
实现 关系 操作 符 != 的 函数 类 
实现 关系 操作 符 < 的 函数 类 
实现 关系 操作 符 <= 的 函数 类 
实现 关系 操作 符 > 的 函数 类 
实现 关系 操作 符 >= 的 函数 类 
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(X) 


实现 逻辑 关系 的 类 





实现 操作 符 && 的 函数 类 
实现 操作 符 | | 的 函数 类 
实现 操作 符 ! 的 函数 类 


logical and«argument type» 














logical or«argument type» 





logical not«argument type» 


产生 函数 对 象 的 函数 





返回 一 个 新 的 一 元 函数 对 象 。 该 对 象 用 其 与 value 
绑 定 的 第 一 个 参数 (bindlst) 或 者 其 第 二 个 参数 
(bind2nd) 调用 二 元 函数 对 象 fn 


返回 一 个 新 的 函数 对 象 ， 且 该 函数 对 象 为 一 元 函数 对 
Z notl 时 返回 true， 反 之 为 二 元 函数 对 象 not2 时 
返回 false 


返回 一 个 调用 特定 函数 指针 的 新 的 函数 对 象 ， 它 可 能 
需要 一 个 或 两 个 同类 型 的 参数 


bindlst (jn, value) 
bind2nd (fn, value) 








notl (fn) 
not2 (fn) 










ptr fun (fnptr) 






返回 一 个 一 元 函数 对 象 ， 并 且 该 函数 对 象 可 以 向 自己 的 参数 增加 常量 1。 因 此 这 个 值 与 通过 
调用 你 在 本 章 前 面 见 到 的 AddKfunction (1) 产生 的 函数 对 象 很 相似 。 函 数 形式 的 优点 就 
是 你 可 以 通过 组 合 不 同 <functional> 接口 所 提供 的 不 同 的 函数 ， 从 而 不 需要 再 定义 一 个 
AddKFunction 类 。 

bindlst 和 bind2nd MIXES «algorithm» 库 的 高 层 的 方法 结合 使 用 时 是 很 有 用 
的 。 例 如 ， 你 可 以 通过 下 面 的 调用 计算 一 个 元 素 类 型 为 整 型 的 矢量 对 象 中 的 负数 的 个 数 ， 


count_if(v.begin(), v.end(), bind2nd(less<int>(), 0)) 


ptr fun 函数 可 以 使 函数 指针 和 函数 对 象 的 概念 一 体 化 。 如 果 fnptr 是 一 个 指向 函数 的 
指针 ， 并 且 需 要 一 个 或 者 两 个 相同 类 型 的 参数 ， 那 么 ptr_fun (fnptr) 返回 一 个 具有 相同 效 
果 的 函数 对 象 。 与 «algorithm» 库 中 函数 所 做 的 一 样 ， 当 你 定义 一 个 以 一 个 函数 指针 或 
者 一 个 函数 对 象 作为 参数 的 函数 时 ， 你 可 以 使 用 这 个 函数 来 避免 代码 重复 。 

为 了 让 你 了 解 如何 应 用 这 种 技术 ,假设 你 想 强 化 20.2 节 中 plot 函数 的 定义 ,使 得 其 
第 二 个 参数 既 可 以 是 一 个 函数 对 象 ， 也 可 以 是 一 个 函数 指针 。 为 此 ， 你 要 复制 图 20-2 的 代 
码 ， 并 且 将 该 函数 的 头 部 修改 为 : 


template «typename FunctionClass> 
void plot(GWindow & gw, FunctionClass fn, 


double minX, double maxX, 
double minY, double maxY) 


函数 体 不 需要 做 任何 变化 。 此 外 ，plot 函数 的 两 个 版 本 可 以 共存 ， 因 为 编译 器 可 以 通过 调 
用 者 提供 的 参数 辨别 使 用 哪个 版 本 。 
然而 ， 在 两 个 版 本 中 使 用 完全 相同 的 代码 是 不 完美 的 。 为 了 避免 这 样 ， 你 可 以 使 用 下 面 
的 代码 重新 实现 函数 - 指针 版 本 的 plot: 
void plot(GWindow & gw, double (*fn) (double), 
double minX, double maxX, 
double minY, double maxY) 


plot(gw, ptr fun(fn), minX, maxX, minY, maxY); 
} 


~~ 
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调用 fun ptr 从 函数 指针 中 产生 了 一 个 函数 对 象 。 这 里 的 函数 指针 可 以 传递 给 男 一 个 plot 
函数 版 本 。 


20.5.2 ”比较 函数 


在 <functional> 库 中 ， 比 较 函 数 尤 为 重要 。 因 为 它们 可 以 让 用 户 定义 自己 的 排 
序 关 系 。 在 <algorithm> 库 中 的 函数 包括 排序 函数 ， 其 中 就 有 表 20-2 中 列 出 的 sort, 
merge, inplace merge, binary search, min element 以 及 max element, 这 
些 函 数 可 以 获取 一 个 可 选 的 函数 式 参数 来 定义 顺序 。 按 照 系 统 默认 ， 这 个 参数 通过 调用 与 值 
类 型 相 匹配 的 less 类 的 构造 函数 而 生成 。 为 了 使 用 不 同 的 顺序 ， 用 户 可 以 自己 提供 函数 指 
针 和 函数 对 象 。 这 类 函数 被 称 为 比较 函数 (comparision function)， 它 需要 两 个 变量 ， 返 回 一 
个 布尔 类 型 的 值 ， 并 且 当 第 一 个 值 在 第 二 个 值 之 前 出 现时 返回 true。 

作为 一 个 简单 的 例子 ， 你 可 以 通过 下 面 的 调用 对 元 素 类 型 为 整 型 的 矢量 对 象 vec 逆序 
HET: 


sort(vec.begin(), vec.end(), greater«int»()); 


在 这 个 调用 中 ， 比 较 函 数 是 greater<int> 的 一 个 实例 ， 而 不 是 默认 的 lesscint» 的 一 
个 实例 ， 这 也 就 意味 着 顺序 是 相反 的 。 
你 可 以 使 用 函数 指针 或 者 函数 对 象 作 为 比较 函数 。 例 如 ， 如 果 你 定义 了 以 下 函数 : 


bool lessIgnoringCase(string sl, string s2) ( 
return toLowerCase(sl) « toLowerCase(s2); 


) 
在 忽略 大 小 写 的 情况 下 ， 你 可 以 调用 以 下 语句 对 元 素 类 型 为 字符 串 类 型 的 矢量 对 象 names 
进行 排序 : 

sort(names.begin(), names.end(), lessIgnoringCase()); 


用 近乎 同样 的 方法 ， 你 可 以 通过 定义 函数 : 


bool isShorter(string sl, string s2) { 
return sl.length() < s2.length() ; 
) 


并 且 调 用 : 

sort(words.begin(), names.end(), isShorter()); 
对 元 素 类 型 为 字符 串 类 型 的 矢量 对 象 words 按 由 短 到 长 的 顺序 排序 。 

你 也 可 以 将 一 个 比较 函数 传 给 Map 类 和 Set 类 的 构造 函数 ， 从 而 确定 元 素 的 出 现 次 
FF. Graph 类 依靠 这 种 机 制 确保 了 所 有 的 节点 和 弧 的 出 现 次 序 依 赖 于 节点 名 称 。 
20.6 ” 迁 代 器 的 实现 

上 一 节 ， 你 已 经 学 到 如 何在 STL 库 中 使 用 迭代 器 。 为 了 完备 性 ， 观 察 这 些 类 型 是 如 何 
实现 的 非常 重要 。 因 此 你 必须 了 解 它 在 底层 表示 。 
20.6.1 为 矢量 类 实现 迭代 器 

为 矢量 类 实现 迭代 器 提供 了 一 个 相对 直接 的 挑战 。 矢 量 类 Vector 的 底层 结构 定义 为 


R R B 613 


一 个 简单 的 动态 数组 ， 而 迭代 器 需要 保存 的 唯一 状态 信息 是 当前 的 索引 值 以 及 一 个 返回 矢量 
类 对 象 的 指针 。 因 此 ，iterator 类 的 私有 变量 可 以 定义 以 下 : 


const Vector *vp; 
int index; 


变量 vp 是 一 个 指向 const Vector 的 指针 ， 让 编译 器 知道 迭代 器 的 操作 不 能 改变 Vector 
对 象 本 身 。Vector 类 中 的 begin 函数 需要 返回 一 个 迭代 器 ， 该 迭代 器 中 变量 vp 指向 
Vector 本 身 ， 而 变量 index 置 为 0。end 函数 必须 返回 一 个 迭代 器 ， 该 迭代 器 中 vp 同样 
被 初始 化 指向 Vector 对 象 本 身 ， 而 index 被 置 为 Vector 对 象 中 以 count 变量 存储 的 
元 素数 目 。 如 果 iterator 类 中 包含 一 个 构造 函数 ， 该 构造 函数 获取 两 个 参数 ， 并 且 使 用 
它们 初始 化 相对 应 的 实例 变量 ， 如 下 所 示 : 


iterator(const Vector *vp, int index) { 
this->vp = vp; 
this->index = index; 
} 
那么 这 些 函 数 都 可 以 很 容易 实现 。 
Vector 类 需要 访问 该 构造 函数 ,但 是 对 用 户 来 说 这 是 不 可 能 实现 的 。 实 现 这 个 目标 的 
最 简单 方法 就 是 将 vector 类 声明 为 iterator 类 的 友 元 。 那 么 begin fll ena 的 实现 如 
下 所 示 : 
iterator begin() const { 


return iterator(this, 0); 


} 


iterator end() const { 
return iterator(this, count) ; 


) 


从 这 一 点 来 看 ， 所 有 剩余 的 操作 就 是 实现 不 同 的 操作 符 。 图 20-9 表示 的 是 为 Vector 
类 实现 的 iterator 类 的 代码 。 


/* 
* Nested class: iterator 
* 


* This nested class implements a standard iterator for the Vector class. 


X 
class iterator ( 


public: 


Implementation notes: iterator constructor 


The defauit constructor for the iterator returns an invalid iterator 
in which the vector pointer vp is set to NULL. Iterators created by 
the client are initialized by the constructor iterator(vp, k), which 
appears in the private section. 


iterator() ( 
this-»vp - NULL; 
l 





图 20-9 Vector # iterator 类 中 的 实现 
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Implementation notes: dereference operator 


* The * dereference operator returns the appropriate index position in 
* the internal array by reference. 


ValueType & operator*() { 
if (vp == NULL) error("Iterator is uninitialized"); 
if (index < 0 || index »- vp-»count) error("Iterator out of range"); 


return vp-»array [index]; 


Implementation notes: ~> operator 


Overrides of the -> operator in C++ follow a special idiomatic pattern 
The operator takes no arguments and returns a pointer to the value. 
The compiler then takes care of applying the -» operator to retrieve 
the desired field. 


ValueType *operator-»() ( 
if (vp == NULL) error("Iterator is uninitialized"); 
if (index < O || index >= vp-»count) error("Iterator out of range"); 


return &vp-»array [index]; 


Implementation notes: selection operator 


* The selection operator returns the appropriate index position in 
the internal array by reference. 


ValueType & operator[](int k) ( 
if (vp == NULL) error("Iterator is uninitialized"); 
if (index + k < 0 || index + k >= vp-»count) ( 
error("Iterator out of range"); 


) 


return vp->array [index + k]; 


Implementation notes: relational operators 


These operators compare the index field of the iterators after making 
* sure that the iterators refer to the same vector. 


bool operator--(const iterator & rhs) { 
if (vp != rhs.vp) error("Iterators are in different vectors"); 
return vp -- rhs.vp && index -- rhs.index; 

} 


bool operator!=(const iterator & rhs) { 
if (vp != rhs.vp) error("Iterators are in different vectors"); 
return !(*this -- rhs); 


) 


bool operator«(const iterator & rhs) ( 
if (vp != rhs.vp) error("Iterators are in different vectors"); 
return index « rhs.index; 


) 


bool operator<=(const iterator & rhs) { 
if (vp != rhs.vp) error("Iterators are in different vectors"); 
return index <= rhs.index; 


) 


bool operator» (const iterator & rhs) ( 
if (vp !- rhs.vp) error("Iterators are in different vectors"); 
return index » rhs.index; 





图 20-9 (£x) 
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bool operator>=(const iterator & rhs) ( 
if (vp != rhs.vp) error("Iterators are in different vectors"); 
return index »- rhs.index; 


Implementation notes: ++ and -- operators 


These operators increment or decrement the index. The suffix versions 
of the operators, which are identified by taking a parameter of type 
int that is never used, are more complicated and must copy the original 
iterator to return the value prior to changing the count. 


iterator & operator++() { 
if (vp == NULL) error("Iterator is uninitialized") ; 
index++; 
return *this; 


) 


iterator operator++(int) ( 
iterator copy(*this) ; 
operator++() ; 
return copy; 


} 


iterator & operator--() { 
if (vp == NULL) error("Iterator is uninitialized") ; 
index--; 
return *this; 


) 


iterator operator--(int) ( 
iterator copy(*this); 


operator--(); 
return copy; 


/* 


* Implementation notes: arithmetic operators 


* These operators update the index field by the increment value k. 


x7 


iterator operator+(const int & k) { 
if (vp == NULL) error ("Iterator is uninitialized"); 
return iterator (vp, index + k); 

) 


iterator operator-(const int & k) ( 
if (vp -- NULL) error("Iterator is uninitialized"); 
return iterator(vp, index - k); 


) 


int operator- (const iterator & rhs) { 
if (vp -- NULL) error("Iterator is uninitialized"); 
if (vp != rhs.vp) error("Iterators are in different vectors"); 
return index - rhs.index; 


/* Private section */ 
private: 


const Vector *vp; /* Pointer to the Vector object */ 
int index; /* Index for this iterator */ 


Implementation notes: private constructor 
The begin and end methods use the private constructor to create iterators 


initialized to a particular position. The Vector class must therefore be 
declared as a friend so that begin and end can call this constructor. 


iterator(const Vector *vp, int index) ( 
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this-»vp = ; 
this-»index = index; 
) 


friend class Vector; 





图 20-9 (£X) 


图 20-9 中 的 函数 包含 了 大 量 的 检查 ， 从 而 确保 迭代 器 的 合理 使 用 。 如 果 用 户 试 图 使 用 
一 个 未 初始 化 的 迭代 器 ， 或 者 对 一 个 超出 范围 的 迭代 器 进行 解析 引用 ， 或 是 对 元 素 类 型 不 同 
的 Vector 对 象 的 迭代 器 进行 比较 ， 那么 程序 会 调用 error 来 报告 错误 。 尽 管 STL 库 中 的 
一 些 实现 也 是 这 样 ， 但 是 大 多 数 实现 都 不 是 如 此 。 使 用 一 个 很 少 执行 错误 检查 或 不 执行 错误 
检查 的 实现 会 使 得 纠 错过 程 很 困难 。 

另 一 方面 ， 如 果 你 愿意 放弃 一 些 错误 检查 来 简化 代码 ， 与 图 20-9 中 的 代码 相 比 较 ， 你 
可 以 用 少量 的 代码 为 Vector 类 实现 其 迭代 器 。 了 人 解 如 何 做 到 这 一 点 需要 用 一 种 不 同 的 方 
式 来 观察 C++ 迭代 器 的 需求 ， 我 们 将 在 下 节 中 讨论 。 


20.6.2 ”将 指针 作为 迭代 器 


图 20-9 中 代码 如 此 之 长 的 大 部 分 原因 是 RandomAccessIterator 提供 的 服务 需要 定 
义 大 量 的 操作 符 。 为 了 确保 迭代 器 的 操作 像 用 户 所 期 望 的 那样 ， 迭 代 器 的 实现 必须 定义 下 面 
每 一 个 操作 符 : 


* => [] == l= < <= > >= ++ == + = 


然而 ， 这 里 没有 通过 在 一 个 类 中 定义 方法 从 而 实现 提供 这 些 操作 符 的 需求 。 如 果 你 已 
经 有 一 个 以 合适 的 方式 实现 这 些 操作 符 的 类 型 ， 就 可 以 使 用 该 类 型 作为 一 个 迭代 器 。 在 
C++ 中 ， 指 针 类 型 对 所 有 这 些 操 作 符 都 能 正确 实现 ， 这 就 意味 着 你 可 以 使 用 指针 值 作为 迭 
fit o 

ik (Cae A RECURSUS: 你 可 以 使 用 C++ 传统 的 数组 以 及 «algorithm» f£ 
口 提供 的 函数 。 例 如 ， 如 果 你 有 一 个 名 为 array 的 数组 ， 其 实际 的 大 小 存储 在 变量 n 中 ， 
你 可 以 通过 以 下 调用 对 该 数组 进行 排序 : 


sort(array, array + n); 


数组 名 被 认为 是 指向 该 数组 第 一 个 元 素 的 指针 ， 指 针 增 量 array+n 指向 第 n«1 个 元 素 。 

和 欠 代 器 可 以 是 指针 ， 这 一 事实 提供 了 另 一 种 为 Vector 类 实现 迭代 器 的 一 种 策略 。 
如 果 和 迭代 器 仅仅 是 指向 数组 中 适当 元 素 的 指针 ， 你 需要 像 下 面 这 样 定义 begin 和 end 
PRÉC: 

ValueType *begin() const ( 


return array; 


} 


ValueType *end() const ( 
return array * count; 


} 
那么 ， 所 有 操作 符 都 不 需要 定义 。 
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然而 ， 你 必须 在 定义 中 包含 一 种 额外 的 定义 ， 为 了 使 基于 范围 的 forz 语句 能 够 对 
Vector 类 起 作用 。C++ 编译 器 将 基于 范围 的 for 循环 : 
for (pe var : collection) { 


hody of the loop 


} 


转换 为 下 面 传统 的 for 循环 ， 其 中 ctype 代表 集合 的 类 型 ，it 是 在 别处 不 使 用 的 私有 的 迭 
代 需 变量 : 
for (ctype::iterator it = collection.begin() ; 
it !- collection.end() ; it++) { 
type var = *it; 
body of the loop 
) 


A f p uEDUR Fed RE SEE EF, XX HAUS — T Hx E TE Vector 类 中 名 为 iterator 
的 嵌 套 类 型 。 在 实现 中 ， 该 类 型 应 该 简化 成 一 个 指向 值 类 型 的 指针 ， 但 是 必须 命名 为 
iterator， 因 为 这 是 编译 器 所 期 望 的 。 幸 运 的 是 , C++ 可 以 对 已 经 存在 的 类 型 名 重新 命名 ， 
这 将 会 在 下 一 节 中 进行 介绍 。 


20.6(3 typedef 关键 字 


C++ 包含 了 一 种 从 C 语言 继承 而 来 的 机 制 ， 这 种 机 制 允许 程序 员 给 已 经 存在 的 类 型 
重新 命名 。 如 果 你 在 任意 的 变量 声明 前 面 加 关键 字 typedef， 编 译 器 会 定义 该 声明 中 的 
每 一 个 名 字 为 该 类 型 名 的 同义词 ， 并 且 该 名 字 将 作为 一 个 变量 。 正 如 该 准则 说 明 的 那样 ， 
声明 : 

char *cstring; 
定义 变量 cstring 为 一 个 指向 char 类 型 的 指针 。typedef 声明 : 


typedef char *cstring; 


定义 类 型 名 cstring 为 “指向 char 类 型 的 指针 类 型 ”， 因 此 是 char * 类 型 的 同义词 。 

尽管 很 容易 过 度 使 用 关键 字 typedef， 但 它 在 某 些 情况 下 会 非常 有 用 。 一 种 常见 的 应 
用 是 为 函数 指针 类 型 提供 一 个 简洁 的 名 字 。 你 在 阅读 本 章 的 过 程 中 可 能 会 注意 到 : 函数 指针 
参数 的 声明 通常 很 长 并 且 很 复杂 ， 因 此 在 实际 中 为 这 些 参数 提供 一 个 简洁 的 类 型 名 意义 重 
大 。 为 了 减少 复杂 性 ， 例 如 ， 通 过 在 Map 类 的 定义 中 包含 以 下 的 一 行 ， 你 可 以 定义 类 型 名 
mapCallback, 使 得 它 是 类 型 “一 个 参数 类 型 为 keyType fll valueType, 并且 没有 返 
回 值 的 函数 指针 ”的 同义词 : 

typedef void (*mapCallback) (KeyType, ValueType) ; 
HBA, mapAl1l 函数 的 原型 就 变 为 : 

void mapAll(mapCallback fn) 
从 而 取代 了 下 面 长 的 版 本 (尽管 可 以 认为 更 有 益 的 ): 

void mapAll(void (*fn) (KeyType, ValueType)) 


typedef 关键 词 是 你 在 完成 Vector 类 的 迭代 器 类 型 的 改进 实现 中 所 需要 的 。 你 需要 
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在 Vector 类 的 公共 部 分 提供 下 面 的 定义 : 


typedef ValueType *iterator; 


20.6.4 ”为 其 他 集合 类 实现 迭代 器 


尽管 为 Vector 类 实现 迭代 器 解决 了 大 多 数 复杂 问题 ,但 是 为 Vector 类 实现 迭代 器 
比 为 大 多 数 其 他 集合 函数 实现 迭代 器 更 加 简单 。 为 Grid 类 和 HashMap 类 定义 迭代 器 并 不 
是 太 困 难 ， 你 会 在 习题 中 体会 到 这 一 点 。 然 而 ， 为 像 Map 一 样 具 有 树 结构 的 类 定义 一 个 和 迭 
代 器 会 变 得 很 麻烦 ， 主 要 是 因为 在 实现 中 必须 将 递归 结构 转换 成 迭代 。 通 常 ， 将 迭代 器 的 
实现 交 给 专家 是 很 明智 的 ， 就 像 依靠 专家 去 编写 随机 数 产 生 器 、 哈 希 函 数 以 及 排序 算法 会 


更 好 。 


本 章 小 结 

本 章 使 用 迭代 遍历 一 个 集合 类 中 的 元 素 这 一 问题 作为 一 个 框架 ， 从 而 介绍 许多 有 趣 
的 主题 ， 这 些 主题 包含 迭代 器 (iterator)， 函 数 指针 (function point)， 函 数 对 象 ( function 
object), STL«algorithm» 库 以 及 在 C++ 中 使 用 函数 编程 范式 的 技巧 。 

本 章 包 含 的 重要 概念 有 : 


Stanford 类 库 和 Stanford 模板 库 中 的 所 有 集合 类 都 提供 了 一 个 其 内 部 艇 套 的 
iterator 类 ， 它 支持 循环 遍历 一 个 集合 类 中 的 元 素 。 

在 C++ P, iterator 的 语法 基于 与 指针 相同 的 操作 集 的 计算 。 然 而 ， 不 是 所 有 的 
迭代 器 都 支持 应 用 于 指针 上 的 所 有 操作 集 。 因 此 ， 和 迭代 器 提供 不 同 层次 的 服务 取决 
于 它们 定义 的 集合 类 的 能 力 。 图 20-1 中 表示 的 是 迭代 器 功能 的 层次 结构 。 

除了 提供 本 身 的 iterator 类 型 ， 每 个 类 也 都 提供 begin 和 enda 方 法 ， 它 们 分 别 
返回 指向 首 元 素 和 最 后 一 个 元 素 之 后 的 迭代 器 。 

C++ 编译 器 将 基于 范围 的 for 循环 : 


for (type var : collection) ( 
body of the loop 
) 


转换 为 以 下 的 for 循环 ， 其 中 ctype 表示 集合 类 元 素 的 类 型 ，it 是 一 个 私有 的 迭代 
变量 : ; 


for (ctype::iterator it = collection.begin() ; 
it != collection.end() ; it++) 
type var 2 *it; 
body of the loop 


) 


在 大 部 分 现代 计算 机 中 使 用 的 冯 ， 诺 依 曼 体 系 结构 中 ， 每 一 个 函数 存储 在 内 存 里 ， 
因此 拥有 一 个 地 址 。 在 C++ 中 ， 指 向 函数 的 指针 是 合法 的 数据 值 。 

映射 函数 对 一 个 集合 类 中 的 每 一 个 元 素 调用 一 个 用 户 指定 的 回调 函数 。 因 此 ， 了 映射 
函数 可 以 作为 迭代 器 用 于 许多 相同 的 上 下 文中 ,或 者 是 基于 范围 的 for 循环 中 。 
传统 的 映射 函数 给 回调 函数 传递 额外 的 数据 是 很 困难 的 。 为 了 解决 这 个 问题 ，C++ 
支持 函数 对 象 ， 它 在 一 个 实现 函数 调用 操作 符 的 类 实例 中 封装 必要 的 数据 和 操作 。 
STL«algorithm» 库 中 包含 了 对 集合 操作 的 通用 算法 的 实现 。 这 些 函 数 中 的 大 部 分 
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需要 迭代 器 来 指定 元 素 的 范围 。 

e 即使 C++ 被 设计 使 用 命令 式 范 型 和 面向 对 象 的 范 型 ， 它 也 可 以 被 用 于 一 一 尤其 是 在 
«functional» 的 辅助 下 一 一 支持 函数 编程 模型 的 特定 方面 。 

e 比较 函数 能 够 对 <algorithm> FFP mR RXR Map 和 Set 这样 的 集合 类 指定 
新 的 顺序 关系 ， 它 需要 确定 元 素 的 相对 顺序 。 

e C++ 包含 关键 字 typedef， 它 可 以 为 已 经 存在 的 类 型 名 定义 新 的 名 字 。 理 解 
typedef 是 如 何 工 作 的 最 简单 的 方式 是 记 住 : 输入 一 条 typedef 语句 之 后 ， 如 果 
你 去 掉 关 键 字 typedef， 那 么 该 语句 则 声明 一 个 新 的 变量 。 

e 为 一 个 新 的 类 实现 迭代 器 需要 仔细 的 考虑 和 大 量 的 代码 。 通 常 ， 把 这 个 工作 交 给 专 
家 可 能 更 明智 。 921 


复习 题 


1. 假设 你 有 一 个 名 为 primes 的 Set<int> 变量 。 如 何在 不 使 用 基于 范围 的 for 循环 前 提 下 ， 使 用 
迭代 器 将 primes 中 的 所 有 元 素 按照 升序 输出 。 
2. 假设 变量 it 是 一 个 迭代 器 ， 描 述 表达 式 *it++ 的 作用 。 
3. 判断 题 : 如 果 c 是 一 个 非 空 集 合 ， 调 用 c.begin () 返回 一 个 指向 该 集合 第 一 个 元 素 的 迭代 器 。 
4. 判断 题 : 如 果 c 是 一 个 非 空 集 合 ， 调 用 c.end() 返回 一 个 指向 该 集合 最 后 一 个 元 素 的 迭代 器 。 
5. 图 20-1 中 表示 的 迭代 器 继承 层次 的 UML Él, ForwardIterator 中 的 方法 列表 为 空 。 为 什么 会 存 
在 这 种 层次 ? 
6.18 - 诺 依 曼 结构 的 哪个 特性 使 得 可 以 定义 指向 函数 的 指针 ? 
7. 描述 下 面 两 个 声明 的 区 别 : 
char *f(string): 
char (*f) (string); 
8. 如 何 将 变量 fn 声明 为 : 一 个 以 两 个 整数 作为 形 参 并 且 返 回 值 为 布尔 类 型 的 函数 的 指针 。 
9. 什么 是 回调 函数 ? 
10. 什么 是 映射 函数 ? 
11. 用 自己 的 语言 描述 函数 指针 和 函数 对 象 的 区 别 。 
12. 根据 定义 ， 每 个 函数 类 都 要 实现 一 个 特定 的 操作 符 。 这 个 操作 符 是 什么 ? 
13. 由 STL<algorithm> 库 提供 的 sort 函数 的 两 个 参数 是 什么 ? 922 
14. 本 章 中 描述 的 函数 式 编程 范 型 的 主要 性 质 是 什么 ? 
15. 判断 题 : 从 binary function 继承 的 一 个 函数 类 中 ， 两 个 参数 的 类 型 必须 相同 。 
16. «£unctional» 库 中 包含 函数 bindlst 和 bind2nd 的 目的 是 什么 ? 
17. 使 用 <functional> 库 中 的 功能 编写 一 个 调用 count if, 使 其 返回 元 素 类 型 为 整 型 的 Vector 
WR vec 中 偶数 的 个 数 。 
18. 比较 函数 是 什么 ? 
19. 描述 下 面 typedef 语句 产生 的 类 型 : 
typedef void (*proc) (); 
20. 列 出 实现 一 个 能 够 提供 RandomAccessIterator 层 服 务 的 迭代 器 所 需要 的 完整 操作 和 集 。 
21. 判断 题 : C++ 中 的 指针 定义 了 实现 一 个 RandomAccessIterator 的 所 有 必需 的 操作 符 。 


习题 
1. 重新 编写 图 5-11 中 的 程序 wordFredquency， 使 它 使 用 迭代 器 代替 在 实现 中 出 现 3 次 基于 范围 的 
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for 循环 。 


2. 在 图 20-2 H, plot 函数 作为 独立 困 数 出 现 。 为 了 使 用 户 易于 使 用 ， 将 这 个 函数 放 和 库 中 会 更 好 。 


创建 必要 的 plot.h fllplot.cpp 文件 ， 从 而 通过 这 个 接口 提供 plot 函数 的 两 个 版 本 ， 其 中 一 个 
以 函数 指针 为 参数 ， 男 一 个 以 函数 对 象 为 参数 。 既 然 你 早已 经 完成 了 该 代码 ， 本 题 的 难点 就 在 于 理 
fif plot.h 需要 哪 部 分 代码 以 及 plot .cpp 需要 哪 部 分 代码 。 

使 用 新 的 plot .h 接口 绘制 一 个 展示 大 部 分 常见 复杂 类 的 增长 曲线 图 : 这 些 复杂 类 包含 常量 、 
对 数 、 线 性 、N log NM、 二 次 方程 式 和 指数 。 如 果 你 使 用 x 的 范围 为 1 到 15， 并 且 使 用 y 的 范围 为 0 
到 50， 那 么 ， 这 个 图 应 如 下 所 示 : 


8.090 








FERRET A, PAM plot 有 6 个 参数 : 图 形 窗口 、 要 绘制 的 函数 ， 以 及 两 对 指明 x 和 y 方向 绘制 


范围 的 值 。 你 可 以 通过 plot 函数 计算 出 y 方向 上 绘制 的 范围 的 方式 来 消除 最 后 两 个 参数 。 你 需要 
对 这 个 计算 执行 两 次 ， 一 次 是 找 出 函数 的 最 大 值 和 最 小 值 ; 另 一 次 是 使 用 这 些 值 作为 绘制 函数 的 界 
限 范围 。 以 你 在 习题 2 中 编写 的 plot 库 为 起 点 ， 增 加 一 个 新 的 能 够 自动 计算 y 方 向 界限 的 plot 
版 本 。 


4. 你 可 以 使 用 函数 指针 以 函数 名 的 方式 保存 一 个 数学 函数 Map 对 象 。 例 如， 如 果 你 采用 以 下 的 声明 


语句 : 
typedef double (*doubleFn) (double); 
Map<string,doubleFn> functionTable; 
然后 ， 你 可 以 通过 给 functionTable MPR A H MY 77 sz BR f 61] PHBL OK FF f o HE PRG. n] 
如 ， 下 面 的 两 行 代码 从 <cmath> 库 中 增加 sin 和 cos 函数 : 
functionTable["sin"] = sin; 
functionTable["cos"] = cos; 
使 用 这 种 方法 给 第 19 章 中 的 表达 式 解 释 器 增加 标准 数学 函数 。 这 个 改变 要 求 你 给 原 有 的 结构 做 
如 下 一 些 扩 展 : 
。 解释 器 在 计算 中 必须 使 用 实数 而 非 整 数 。 你 在 第 19 章 中 的 习题 8 已 经 做 过 这 个 改变 。 
e 函数 表 需 要 融 人 EvaluationContext 类 ， 以 便 解释 器 可 以 通过 名 字 访 问 函 数 。 
e 语法 分 析 器 需要 包含 一 条 对 于 表达 式 的 新 的 语法 规则 ， 使 得 该 表达 式 表 示 的 是 只 含 一 个 参数 的 天 
数 调 用 。 
e 对 于 新 的 函数 类 来 说 ，eval 方法 必须 能 够 在 函数 表 中 查询 函数 名 ， 接 着 将 该 函数 应 用 于 计算 参 
数 的 结果 中 。 
你 的 实现 代码 应 该 像 C++ 那样 允许 函数 的 结合 和 垦 套 。 例 如 ， 如 果 你 的 解释 器 定义 了 sqrt, sin 
和 cos 函数 ， 程 序 应 该 能 够 产生 下 面 简单 的 运行 结果 : 
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(6 OO interpreter 


[e 一 一 一 一 一 一 
=> sqrt (2) 

1.41421 | 
=> sqrt (sqrt (sqrt (256))) 

2 


=> cos (0) 

=> PI = 3.14159265358 
3.14159 

=> sin(PI / 2) 

1 


=> sin(PI / 6) 


mx = 5 
5 
=> y = 12 
12 


=> sqrt(x * x + y * y) dH 
13 a 
v 
i | 


5. 以 习题 4 KLAN Expression 类 的 扩展 版 本 作为 起 点 ， 创 建 一 个 名 为 BxpressionEunction 的 
函数 类 ， 它 将 一 个 表达 式 字符 串 转化 为 一 个 函数 对 象 ， 该 函数 对 象 将 变量 x 的 值 代入 它 的 计算 结果 
中 。 例 如 ， 如 果 你 调用 以 下 构造 函数 : 


ExpressionFunction("2 * x + 3") 


那么 ， 返 回 的 结果 应 该 是 一 个 你 可 以 使 用 单个 参数 调用 的 函数 。 因 此 ， 如 果 你 调用 : 
ExpressionFunction("2 * x + 3")(7) 
那么 ， 结 果 应 该 是 表达 式 2*7+3 的 值 ， 即 14. 

6. 将 习题 5 f] ExpressionFunction 机 制 和 习题 3 AY plot 函数 相 结合 ， 使 得 plot 函数 参数 可 以 
是 一 个 表示 含有 变量 x 的 表达 式 的 字符 串 。 例 如 ,在 对 plot.h 接口 做 出 这 些 扩展 后 ， 你 应 该 能 够 
调用 以 下 语句 生成 20.2.2 一 节 中 展示 的 正弦 波形 : 
plot(gw, "sin(x)", -2 * PI, 2 * PI, 1, 1) 
然而 ， 表 达 式 字符 串 可 以 使 用 任何 能 够 被 表达 式 语 法 分 析 器 识别 的 机 制 ， 因 此 你 可 以 使 用 它 来 绘制 
更 复杂 的 函数 ， 就 像 下 面 的 调用 说 明 的 一 样 : 
plot(gw, "sin(2 * x) * cos(3 * x)", -PI, PI) 

这 条 语句 使 用 ExpressionFunction 生成 一 个 计算 表达 式 sin (2*x) +cos (3*x) 的 函数 对 象 ， 
接着 使 用 该 函数 对 象 产 生 下 面 的 图 形 : 











7. 在 微 积分 中 ， 一 个 函数 的 积分 定义 为 水 平方 向 上 边界 与 由 水 平方 向 上 的 边界 以 及 函数 所 确定 的 垂直 
方向 的 值 所 围 成 的 面积 。 例 如 ，0 到 m 范围 内 的 正弦 函数 的 积分 就 是 下 图 中 的 阴影 面积 : 
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你 可 以 通过 将 这 些 固定 宽度 的 小 矩形 的 面积 相 加 起 来 ， 从 而 计算 出 这 个 区 域 的 近似 面积 ， 这 些小 矩 
形 的 高 度 为 函数 在 该 矩形 中 点 处 的 函数 值 : 





设计 该 原型 并 为 一 个 名 为 integrate 的 函数 编写 代码 , 它 通过 求 这 些 和 矩形 的 面积 之 和 来 估算 
该 区 域 的 面积 。 例 如 ， 为 了 计算 前 面 例 子 中 阴影 区 域 的 面积 ， 用 户 要 编写 以 下 语句 : 


double value = integrate(sin, 0, PI, 20); 


最 后 一 个 参数 是 该 区 域 被 分 成 的 矩形 的 数量 ; 这 个 值 越 大 ， 估 算 值 就 越 精确 。 
注意 到 在 x 轴 下 方 的 任何 区 域 都 被 看 作 是 负面 积 。 因 此 ， 如 果 你 计算 sn 从 0 到 2 的 面积 ， 
那么 结果 会 是 0， 因为 坐标 轴 上 方 和 下 方 的 面积 会 相互 抵消 。 

8. 实现 «algorithm» 库 中 的 函数 模板 : 

template «typename IterType» 

IterType max element(IterType begin, IterType end); 

它 返 回 一 个 指向 迭代 范围 内 最 大 的 元 素 的 迭代 器 。 由 于 大 部 分 标准 库 中 都 包含 «algorithm», f/ 
可 以 为 该 函数 起 一 个 不 同 的 名 字 。 

9. 编写 «algorithm» 库 中 的 函数 模板 count_if 原型 ， 然 后 再 实现 它 。 

10. 20.5.2 一 节 中 的 lessIgnoringcase 代码 是 低 效 的 ， 因 为 即使 它 能 够 通过 查找 第 一 个 字符 来 确 
定 相 对 的 顺序 也 还 是 一 直 将 字符 串 转化 为 小 写字 母 。 编 写 一 个 更 加 高 效 的 lessIntegringCase 
版 本 ， 使 其 能 够 尽 可 能 少 看 一 些 字符 来 确定 结果 。 

11. 编写 一 个 比较 函数 titleCcomesBefore， 它 以 两 个 字符 串 作 为 形 参 并 比较 它们 ， 并 且 符 合 下 面 的 
规则 : 

e 这 个 比较 应 该 忽略 大 小 写 。 
e 除了 空格 以 外 的 标点 符号 都 应 该 被 忽略 。 
e 出 现在 标题 开头 的 单词 a、an 和 the 都 应 被 忽略 。 

12. 在 图 17-4 中 表示 的 Set 类 的 实现 中 ,集合 == 操作 符 的 代码 是 基于 两 个 集合 相等 当 且 仅 当 每 一 个 
集合 是 对 方 的 子 集 这 一 数学 原则 。 尽 管 依赖 该 机 制导 致 实现 很 简洁 ， 但 并 不 是 特别 高 效 。 一 种 检测 
两 个 集合 是 否 相 等 的 更 迅速 方式 是 : 如 果 你 对 这 两 个 集合 分 别 迭 代 遍 历 ， 你 得 到 的 值 是 否 是 相同 的 。 

在 尝试 解决 这 个 问题 之 前 ， 唯 一 一 个 需要 解决 的 问题 是 : 第 17 章 中 实现 的 Set 类 不 包括 一 个 


13. 


14. 
15. 
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迭代 器 。 然 而 ， 这 个 实现 位 于 Stanford 类 库 中 的 Map 类 的 顶层 ， 它 提供 一 个 迭代 器 类 。 因 此 ， 
你 可 以 在 每 个 集合 中 创建 必要 的 map 实例 变量 的 迭代 器 。 鉴 于 C++ 中 涉及 模板 类 的 声明 规则 了 星 涩 
难 懂 ， 因 此 ，Set 类 中 Map 迭代 器 的 声明 需要 使 用 关键 字 typedef 标记 ， 这 就 迫使 你 像 下 面 这 
样 编写 声明 : 


typename Map<ValueType,bool> it = map.begin(); 


使 用 这 个 策略 重新 在 set .h 接口 中 实现 == 操作 符 。 

参考 图 15-8， 为 StringMap 类 实现 一 个 迭代 器 。 这 个 类 是 HashMap 的 一 个 特 化 版 本 ， 它 意味 着 
迭代 器 可 以 按照 任意 顺序 处 理 元 素 。 

为 Gria 类 实现 一 个 迭代 器 ， 使 其 按照 行 优先 的 顺序 处 理 元 素 。 

为 了 给 你 自己 一 个 更 大 的 挑战 ， 为 第 16 章 中 的 Map 类 实现 一 个 迭代 器 ， 它 基于 二 又 搜索 树 。Map 
迭代 器 总 是 按照 升序 来 处 理 元 素 , 它 对 应 树 的 一 个 中 序 遍 历 。 然 而 ， 当 你 用 迭代 器 实现 这 个 行为 
时 ， 不 能 再 依赖 于 递归 ， 因 为 迭代 器 需要 顺序 操作 。 因 此 ， 当 你 递归 地 实现 中 序 遍 历时 ，Map is 
代 器 的 代码 必须 自动 跟踪 其 元 素 的 状态 。 这 要 求 你 维持 一 个 还 没 被 访问 的 节点 的 栈 。 
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dominating set (支配 集 )，820 
domino (多 米 诺 骨牌 )，306，423 
Domino class (Domino 类 )，306 
dot operator (点 操作 符 )，263 
double rotation ( 双 旋 转 )，712 
double type (double 类 型 )，14，21 
double-precision ( 双 精 度 )，15 
doubly linked list ( 双 链 表 )，606 
draw method (draw 方法 )，832 
drawPolarLine function ( drawPolarLine 
PRL), 373 
dummy cell (4570), 593 
Dylan, Bob (#3) - 迪 伦 )，255 
dynamic allocation (动态 分 配 )，516 
dynamic array (动态 数组 )，518 
E 
Easter date algorithm ( 爱 因 斯 坦 日 期 算法 )，118 
edge (31), 768 
editor (编辑 器 )，571 
EditorBuffer class (EditorBuffer 类 ), 573 
EditorBuffer constructor (EditorBuffer 
构造 函数 )，575 
effective size (有 效 容量 )，498 
Einstein, Albert (阿尔 伯 特 * 爱 因 斯 坦 )，88，120 
Eliot, George (乔治 * 艾 略 特 )，191，206，663 
Eliot, T. S. (托马斯 斯 特 尔 那 斯 * SENE), 125 
embedded assignment (WEWE), 31 
Employee class (Employee 2E), 825 
empty list (Z5 36), 523 
empty set ( 空 集 合 )，738 
empty vector (空间 量 )，199 
encapsulation (封装 )，181 
end method (end 方法 )，889 
endl manipulator (endl 操作 符 )，11，162 
endsWith function (endsWith 函数 )，136，146 
Engels, Friedrich (23 - 恩格斯)，429 
EnglishWords.dat, 235 
enqueue method (enqueue 方法 )，218 
enumerated type( 枚 举 类 型 )，24 
enumeration ( 枚 举 符 )，739 


EOF constant (EOF 常量 )，171 

eof method (eof 方法 )，170 

equal toclass (equal to 类 ), 910 

equalsIgnoreCase function ( equalsIg- 
noreCase PAM), 136, 146 

erase method (erase 方法 )，130 

Eratosthenes ( 埃 拉 托 色 尼 )，249 

error function (error PRO. 75 

error.h interface (error.h 接口 )，78 

error.cpp (error.cpp C++ 源 程序 )，79 

escape sequence ( 转 义 字 符 )，23 

Euclid ( 欧 几 里 得 )，58，345 

eval method (eval 方法 )，850 

evaluatePosition method ( evaluate- 
Position Wy), 413 

exception handling (异常 处 理 )，844 

executable file (可 执行 文件 )，6 

exit function (exit PAR), 75 

EXIT FALLURE constant (EXIT FALLURE # 
Ht), 75 

exp function (exp 函数 )，61 

exp.cpp (exp.cpp C++ 源 程序 )，858 

exp.h interface (exp.h 接口 )，851 

exponential time (指数 时 间 )，450 

exporting constants (导出 的 常量 )，83 

expression tree (表达 式 树 )，849 

expression (表达 式 )，26 

ExpressionFunction class ( Expression- 
Function 2), 925 

ExpressionType type (ExpressionType 类 
型 )，850 

extended-precision arithmetic (扩展 精度 运算 )， 
662 

extending an interface (扩展 一 个 接口 )，90 

extension (扩展 )，191 i 

extern keyword (extern 关键 字 )，83 

extraction operator (抽取 运算 符 )，165 

F 

fact function (fact PAR), 45, 319 

factorial (HÆ), 45, 318 

fail method (fail 方 法 )，170 

false constant (false 常量 )，21 

fib function (fib PAR), 331 

Fib.cpp (Fib .cpp C++ WHF), 328 
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Fibonacci sequence ( 斐 波 纳 契 数列 )，326 

Fibonacci, Leonardo ( 列 奥 纳 多 “. 斐 波 那 契 )，325 

field ( 域 )，262 

FIFO (先进 先 出 )，217 

file (文件 )，167 

filelib.h interface (£ilelib.h 接口 ),，186 

filename extension (文件 扩展 名 )，191 

人 filename root (文件 名 )，191 

fillfunction (fill 函数 )，908 

FillableShape class ( FillableShape %Ž ), 
872 

final state (Æ), 314 

find method (find FÆ), 130, 134, 908 

findBestMove method ( findBestMove J71X), 
413 

findGoodMove method ( findGoodMove Jj 
ik), 402 

findNode method (findNode 方法 )，697 

finite set (有 限 集 )，738 

finite-state machine (有 限 状 态 机 )，314 

first method (first 方 法 )，232 

fixed manipulator (定点 操作 符 )，162 

FlipCoin.cpp (FlipCoin.cpp C++ 源 文件 )， 
95 

float type (float 类 型 )，21 

floating-point ( 浮 点 类 型 )，15，21 

floor function (floor 函数 )，61 

for statement (for 语句 )，43 

for-each function (for-each AM), 908 

foreach macro (foreach /E), 238 

formatted input (格式 化 输入 )，165 

formatted output (格式 化 输出 )，160 

FORTRAN, 4 

forward reference (前 向 引用 )，779 

ForwardIterator, 891 

fractal (JE), 371 

fractal snowflake (雪花 分 形 )，371 

fractal tree (分 形 树 )，386 

fraction (分 数 )，281 

Fredkin, Edward (784 - 弗 雷 德 )，735 

free function (free 函数 )，129 

friend keyword (friend 关键 字 )，275 

fstreamclass (fstream 类 ), 871 

<fstream>library (<fstream> JE), 168 


function (PAX), 10, 56, 61 

function class (函数 类 )，902 

function object (函数 对 象 )，902 

function pointer (函数 指针 )，893 

function prototype (函数 原型 )，62 

functional programming (函数 编程 )，909 

functor (KF), 902 

G 

game trees (游戏 树 )，409 

garbage collection (垃圾 回收 器 )，525 

GATTACA, 157 

Gauss, Carl Friedrich (卡尔 ， 弗 里 德里 希 . 高 斯 )， 
50, 118 

gcd function (gcd PAR), 59, 345 

generateMoveList method ( generate- 
MoveList Jjik), 415 

get method (get FH), 170, 200, 210, 227 

getExtension function ( getExtension PH 
数 )，191 

getInteger function ( getInteger 图 数 )，108， 
180 

getLine function (getLine MAX), 108 

getPosition method (getPosition Jj ik), 
294 

getReal function (getReal PAL), 108 

getRoot function (getRool 函数 )，191 

getters ( 读 取 器 )，265 

getTokenType method ( get TokenType F), 
294 

getType method (getType 方法 )，850 

getX method (getx F), 266 

getY method (getY 方 法 )，266 

giga ( 干 兆 )，475 

global variable (全 局 变量 )，17 

gmath.cpp (gmath.cpp C++ 源 程序 )，107 

gmath .h interface (gmath .h 接口 )，84 

go out of scope (超出 范围 )，526 

GObject class (GObject 类 )，832 

gobjects.cpp (gobjects.cpp C++ 源 程 序 )， 
837 

gobjects.h interface (gobjects .h 接口 )，833 

Goldberg, Adele (M/K - 戈 德 堡 )，5 

golden ratio (黄金 分 割 比 率 )，470 

Google (谷歌 )，809 


630 





GPoint class (GPoint 2), 308 

grammar (语法 )，862 

graph (图 )，768 

graph.h interface (graph.h 接口 )，793，798 

graphical recursion (图 的 递归 )，368 

GraphicsExample.cpp (GraphicsExample. 
cpp C++ 源 程序 )，100 

Gray code (格雷 码 )，512 

Gray, Frank (弗兰克 ' 格雷 )，512 

greater class (greater 2€), 910 

greater equal class (greater equal #), 
910 

greatest common divisor (最 大 公约 数 )，58，345 

Grectangle class (Grectangle 类 )，308 

greedy algorithms (贪心 算法 )，804 

Grid class (Grid 类 ), 210 

Grid constructor (Grid 构造 函数 )，210 

Gödel, Escher, Bach (FR, WEIR., EPA), 52 

H 

H-fractal (H- 4%), 384 

hailstone sequence (冰雹 序列 )，53 

half-life (半生 命 期 )，21 

half-open interval ( 半 开 区 间 )，95 

Hamilton, Charles V. (查尔斯 汉密尔顿 )，1 

Hanoi.cpp (Hanoi.cpp C++ 源 程序 )，356 

Harry Potter ( 哈 利 . 波 特 )，51 

hash code (ÆTI), 672 

hash function (hash Kx), 672 

hash table( 哈 希 表 )，672 

hashing ( 哈 希 )，672 

HashMap class (HashMap 类 )，682 

HashSet class (HashSet 4), 748 

hasMoreTokens method ( hasMoreTokens 77 
ik), 294 

head of a queue (队列 头 )，217 

header file (3: XcffF), 9, 78 

header line (P117), 12 

heap (3E), 516, 721 

heap area (HEX), 481 

heap-stack diagram (HE — E), 536 

heapsort algorithm ( 堆 排 序 算法 )，735 

height of a tree ( 树 的 高 度 )，691 

Heilman, Lillian ( 温 斯 顿 ' 丘吉尔 )，89 

HelloWorld.cpp (HelloWorld.cpp C++ 源 


程序 )，2 

hexadecimal (十 六 进 制 )，20，476 

higher-level language (高 级 语言 )，4 

histogram (直方 图 )，248 

Hoare, C. A. R. (托尼 : 霍 尔 )，452 

Hofstadter, Douglas( 道 格拉 斯. 霍 夫 斯 塔 特 )，52 

holism (整体 论 )，338 

hop (一 跳 )，787 

hybrid strategy (混合 策略 )，469 

| 

IATA, 229 

IBM, 409 

idempotence (ATE), 741 

identifier (标识 符 )，16 

identifier node (标识 符 结 点 )，849 

identity (恒等式 )，741 

if statement (if 语句 )，37 

ifstream class (ifstream 2), 168 

ignoreComments method ( ignoreComments 
方法 )，294 

ignoreWhitespace method ( ignoreWhite- 
space Jj1k), 294 

immutable class (45257255), 267 

implementation (实现 )，78 

implementor (实现 者 )，61 

in-degree (人 度 )，771 

inBounds method (inBounds 方法 )，210 

inclusion/exclusion pattern (包含 /排斥 模式 )， 
363 

increment operator ( 自 增 运算 符 )，33 

index (索引 )，131 

index variable (索引 变量 )，45 

inductive hypothesis (归纳 假设 )，460 

infinite set (无 限 集合 )，738 

information hiding (信息 隐藏 )，87 

inheritance (继承 )，181 

initializer (初始 化 )，16 

initializer list (初始 化 列表 )，839 

inorder traversal (中 序 遍 历 )，704 

inplace merge function (inplace merge 
函数 )，908 

input manipulators (输入 操纵 符 )，166 

Inputlterator, 891 

insert method (insert F), 130, 199 





insertCharacter method(insertCharacter 
Jk), 576 

insertion operator (插入 操作 符 )，160 

insertion sort (插入 排序 )，466 

insertNode function (insertNode PAR), 698 

instance (实例 )，129 

instance variables (实例 变量 )，264 

Instant Insanity (四 色 方 柱 )，422 

int typé (int 类 型 )，14，19 

integer division (整除 )，29 

integerToString function ( integerTo- 
String PUR), 146 

integral (£47), 926 

interface boilerplate (接口 模板 )，78 

interface entry (接口 条 目 )，78 

Interface Message Processor (IMP)[ 接口 消息 处 理 
器 (IMP)]. 821 

interface (#211) 78, 85 

interior node (中 间 结 点 )，691 

International Standards Organization (国际 标准 组 
织 )，5 

Internet (互联 网 )，18，821 

interpreter (解释 器 )，842 

Interpreter.cpp (Interpreter.cpp C++ 
源 程序 )，843 

intersection ( 交 )，232，739 

intractable (#RFAY), 452 

<iomanip> library (<iomanip> JE), 161 

ios class (ios 38), 183 

iostream class (iostream2€), 871 

<iostream> library (<iostream> JE), 9, 160 

isalnum function (isalnum PRX), 137 

isalpha function (isalpha PRX), 137 

isBadPosition method ( isBadPosition Jr 
ik), 402 

isdigit function (isdigit 函数 )，137 

isDigitString function ( isDigitString 
方法 )，138 

isEmpty method (isEmpty 方 法 ), 212, 218, 
227, 232 

isEven function (isEven PAR), 337 

isLeapYear function (isLeapYear PRX), 41 

islower function (islower PA), 137 

isOdd function (isOdd PREX), 337 
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isPalindrome function (isPalindrome PK 
数 )，141，333 
isprint function (isprint AM), 137 
ispunct function (ispunct 函数 )，137 
isspace function (isspace MIX), 137 
isSubsetOf method (isSubsetof 方法 )，232 
istream class (istream 2E), 184 
istringstream class (istringstream # ), 
178 
isupper function (isupper PA), 137 
isVowel function (isVowel PAR), 40 
isWordCharacter method (isWordChar- 
acter F), 294 
isxdigit function (isxdigit Mi), 137 
iter swap function (iter swap Kt), 908 
iteration order (迭代 顺序 )，238 
iterative (3EfV R9), 319 
iterative statement (迭代 语句 )，41 
iterator (迭代 器 )，236，237，506，888 
J 
Jabberwocky (无 聊 的 话 )，167 
Jackson, Peter (皮特 ， 杰克 还 )，519 
James, William (威廉 詹姆斯 )，315 
John von Neumann (24% - 13 - Wik), 893 
Juster, Norton (诺顿 * 贾 斯 特 )，313 
K 
Kasparov, Garry (加 里 卡 斯 帕 罗 夫 )，409 
Kemeny, John (398 - 科 姆 尼 )，886 
Kernighan, Brian( 布 莱恩 : 柯 林 汉 )，2 
key ( 键 )，226，694 
KeyValuePair type ( KeyValuePair 类 型 )， 
664 
kilo (Œ), 475 
King, Martin Luther, Jr. (35 T - 路 德 . 4), 159 
Kipling, Rudyard (和 鲁 德 亚 德 . 吉 卜 林 )，767 
knight's tour (骑士 之 旅 )，422 
Koch snowflake ( 科 赫 雪花 分 形 )，371 
Koch, Helge von (海里 格 . 23 - PHR), 371 
Kruskal, Joseph (约瑟夫 ' s; &NWr-R), 819 
Kuhn, Thomas (托马斯 . FEAL), 4 
Kurtz, Thomas (46431 + FEHR), 886 
L 
Landis, Evgenii (3E 4E2&JE. - “ #74), 708 
Lao-tzu (老子 )，87 
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layered abstraction (分 层 抽 象 )，748 

leaf node (叶子 节点 )，691 

left child (ARF), 694 

left manipulator ( 左 操纵 符 )，162 

left rotation (左旋 转 )，710 

left-associative ( 左 优先 )，28 

leftFrom function (leftFrom 函数 )，80 

Leibniz, Gottfried Wilhelm( 莱 布 尼 芯 )，53 

length method (length 方法 )，130 

less class (less 类 ), 910, 912 

less equalclass (less equal 类 ), 910 

letter-substitution cipher (字母 替换 密 文 )，156 

LetterFrequency.cpp (LetterFrequency. 
cpp C++ 源 程序 )，205 

lexical analysis (词法 分 析 )，842 

lexicographic order (字典 次 序 )，130，239，335， 
695 

lexicon (J), 235 

Lexicon class (Lexicon 2É), 235 

library (JÆ), 6 

LIFO, 211 

Line class (Line 2$), 832 

linear probing (线性 探测 )，688 

linear search (线性 搜索 )，335 

linear structures (线性 结构 )，616 

linear time (线性 时 间 )，438，450 

link (链接 )，520 

linked list (链表 )，519 

linked structure (链接 结构 )，484，519 

linking (链接 )，6 

Linnaeus, Carl (卡尔 林 奈 )，181 

list-based editor (基于 列表 的 编辑 器 )，591 

ListBuffer.cpp (ListBuffer.cpp C++ 源 
程序 )，603 

load factor (加 载 因子 )，681 

local variable (局 部 变量 )，17 

Lodge, Henry Cabot (Efl - 卡 伯 特 : 洛 奇 )，823 

log function (log PRA, 61 

1og10 function (10g10 函数 )，61 

logarithm (X14), 448 

logarithmic time (对 数 时 间 )，450 

logical and (3748-45), 35 

logical not GZ483E), 35 

logical operator (逻辑 操作 符 )，35 





logical or (逻辑 或 )，35 
logical andclass (logic and 类 ), 910 
logical not class (logic not 类), 910 
logical or class (logic or 类 ), 910 
long double type (long double 类 型 )，21 
long type (long 类 型 )，19 
lookup table (查找 表 )，668，669 
loop( 循 环 )，41 
loop-and-a-half problem (循环 一 半 问 题 )，42 
Lucas, Edouard (爱德华 - 卢 卡 斯 )，350 
lvalue ( 左 值 )，485 

M 
machine language (机 器 语言 )，3 
Magdalen College ( 莫 德 林学 院 )，385 
magic square (魔方 )，250 
main function (main 函数 )，11 
majority element (主要 元 素 )，471 
makeMove method (makeMove 方法 )，415 
Mandelbrot, Benoit (本 华 . SWH), 371 
manipulator (操纵 符 )，161 
map (BRIT), 226 
Map class (Map 2$), 226, 664 
map.h interface (map.h 接口 )，665 
mapAll method (mapA11 771A), 898 
mapping function (Sf PRX), 888, 897 
Markov process (马尔 克 夫 过 程 )，809 
Markov, Andrei ( 安 德 烈 .马尔 可 夫 )，809 
mask (面具 ); 757 
mathematical induction (数学 推导 )，460 
max function (max PASE), 617, 908 
max element function(max element KX), 

908 

Maze class (Maze 4), 394 
maze.h interface (maze.h 接口 )，395 
mean (平均 值 )，247 
mega (— AJI), 475 
member (成 员 )，262 
membership (隶属 关系 )，739 
memory allocation (内 存 分 配 )，500 
memory leak (内 存 泄漏 )，525 
memory management (内 存 管理 )，516 
merge function (merge PAR), 908 
merge sort algorithm (归并 排序 算法 )，445 
merging (归并 )，444 


message (I EN), 129 

method (方法 )，129 

metric (度量 标准 )，339 

min function (min 函数 )，908 

min element function(min element PAR), 
908 

Minesweeper game (扫雷 游戏 )，252 

minimax algorithm (〈 求 最 小 最 大 值 算法 )，409 

minimum spanning tree (最 小 生成 树 )，819 

Minotaur ( 弥 诺 陶 洛 斯 )，390 

minus class (minus 类 )，910 

mnemonic ( 助 记 符 )，381 

model (模型 )，219 

model-view-controller pattern( 模 型 -视图 -控制 右 
模型 )，570 

modular arithmetic (模块 化 算法 )，639 

modulus class (modulus 2$), 910 

Mondrian, Piet (£y - 蒙 德里 安 )，368 

Mondrian.cpp (Mondrian.cpp C++ 源 程序 )， 
370 

Monte Carlo integration (蒙特 卡 洛 积 分 )，122 

Month type (Month 类 型 )，25 

Morse code (摩尔 斯 编码 )，257，731 

Morse, Samuel F. B. (*Z&/ - 摩尔 斯 )，257 

move in a game (在 游戏 中 移动 )，407 

moveCursorBackward method (moveCursor- 
Backward jk), 575 

moveCursorForward method (moveCursor- 
Forward F), 575 

moveCursorToEnd method ( moveCursorTo- 
End 方法)，576 

moveCursorToStart method (moveCur- 
sorToStart 方法 )，576 

moveSingleDisk function (noveSingleDisk 
PA, 355 

moveTower function (moveTower PARC), 355 

multiple assignment (多 重 赋值 )，32 

multiple inheritance (多 重 继承 )，871 

multiplies class (multiplies 类 ), 910 

mutator ( 设 值 方法 )，267 

mutual recursion (间接 递归 )，337 

MVC pattern (MVC 模式 )，570 

N 
N log N time (N log N 时 间 ),，450 
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N-queens problem (N 皇后 问题 )，421 

name of a variable (变量 名 )，14 

named constant (命名 常量 )，17 

namespace (名 字 空 间 )，9 

natural logarithm (自然 对 数 )，448 

natural number (自然 数 )，738 

naughts and crosses (十 字 游 戏 )，426 

Naur, Peter( 彼 得: 诺尔 )，863 

negate class (negate 类 ), 910 

neighbor (48/5), 771 

nested type (WREX), 889 

new operator (new 操作 符 )，517 

nextToken method (nextToken 方法 )，294 

Nim game ( 拿 子 游戏 )，401，426 

Nim.cpp (Nim.cpp C++ 源 程序 )，403 

noboolsalpha manipulator ( noboolsalpha 操 
WIF), 162 

node (4), 690, 768 

nondeterministic programs ( 非 终结 程序 )，90 

nonterminal symbol ( 非 终结 符 )，863 

nonterminating recursion ( 非 终结 递归 )，339 

normalization (规范 化 )，99 

noshowpoint manipulator ( noshowpoint 操纵 
IF), 162 

noshowpos manipulator (noshowpos 操纵 符 )，162 

noskipws manipulator (noskipws 操纵 符 )，166 

not equal toclass (not equal to 类 ), 910 

notl function (not1 PRZX), 910 

not2 function (not2 函数 )，910 

nouppercase manipulator ( nouppercase 操纵 
fT), 162 

npos constant (npos 4$ &&), 134 

null character (4554), 23, 503 

NULL constant (NULL 常量 )，491 

null pointer ( 空 指针 )，491 

numCols method (numCols 方法 )，210 

numerator (计算 器 )，284 

numRows method (numRows 方法 )，210 

Nygaard, Kristen (克利 斯 登 . 奈 加 特 )，4 

O 

Obenglobish (Obenglobish), 154 

object (对 象 )，129 

object file (对 象 文 件 )，6 

object-oriented paradigm (面向 对 象 范 型 )，4 
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octal (十 进 制 )，20 

ofstream class (ofstream 类 ), 168 
Olsen, Tillie CAM ij - 奥 尔 森 )，569 
open addressing (开放 寻 址 )，687 
open method (open 方法 )，170 
opening a file (打开 文件 )，168 
operator overloading (操作 符 过 载 )，131，268 
operator (操作 符 )，26，165 
operator!=, 275 

operator+, 287 

operator<<, 272 

operator--, 273 

operator[], 649 

optimization (优化 )，882 

ordinal number (序数 )，152 

origin (Jk £i), 111 

ostream class (ostream), 184 


ostringstream class ( ostringstream 类 )， 


178 
out-degree (HE), 771 
output manipulators (输出 操纵 符 ) , 162 
OutputIterator, 891 
Oval class (Oval 2$), 832 
overhead word (开销 词 )，538 
overloading (过 载 )，63 616 
Oxford University (牛津 大 学 )，385 
P 
P versus NP problem (P 5j NP 问题 ) , 452 
Page, Larry (1H - MA), 809 
PageRank algorithm (PageRank 算法 )，809 
palindrome (EIX), 141, 332 
paradigm shift (45594645), 4 
parameter (4%), 61 
parameterized classes (模板 类 )，198 
parent (父亲 )，691 
parse tree (解析 树 )，847 
parser generator〈 语 法 生成 器 )，864 


parser.cpp (parser.cpp C++ 源 程序 )，865 


parsing (解析 )，842 

parsing an expression (解析 表达 式 )，862 
partially ordered tree ( 偏 序 树 )，719 
partition function (partition PX), 908 
partitioning (分 割 )，454 

Parville, Henri de (FẸ) - 德 * 巴 微 )，350 


žo s 





Pascal, Blaise ( 布 莱 斯 . 帕斯卡 )，347 
Pascal's Triangle (帕斯卡 三 角形 )，347 
path (路 径 )，771 

pattern (模式 )，134 

peek method (peek 方法 )，212，218 
peg solitaire (peg 纸牌 )，423 

perfect number (£42), 117 
permutation (HE9U), 119, 364 


Permutations.cpp (Permutations.cpp 


C++ 源 程序 )，366 
persistent property (持久 性 )，161 
PI constant (PI 常数 )，17，83，84 
Picasso, Pablo (B38 - 毕加索 )，368 
Pig Latin (儿童 黑 话 )，142 
pigeonhole principle (PÉJ), 472 


PigLatin.cpp(PigLatin.cpp C++ 源 程序 )， 


143 
pivot (枢纽 )，454 
pixel (像素 )，111，420 
plot function (plot 函数 )，894，897 
plotting a function (绘制 一 个 函数 )，893 
plus class (plus 2€), 910 
ply (St), 411 
pocket calculator (小 型 计算 器 )，213 
Point class (Point 类 )，266，276 
Point type (Point 类 型 )，262 
point.cpp (point.cpp C++ 源 程 序 )，278 
point.h interface (point.h 接口 )，276 
pointer (指针 )，484 
pointer arithmetic (指针 运算 )，500 
pointer assignment (指针 赋值 )，489 
pointer to a function (指向 函数 的 指针 )，893 
Poisson distribution ( 泊 松 分 布 )，221 
Poisson, Siméon (PHRA - JAMS), 221 
polar coordinates (f^ bg), 373 
polymorphism (ZÆ), 616 
polynomial algorithm (多 项 式 算法 )，451 
pop method (pop 方法 )，212 
portability (可 移植 性 )，20 
postorder traversal (后 序 遍 历 )，704 
PostScript (下 标 )，255 
pow function (pow 函数 )，61 


PowersOfTwo.cpp (PowerOfTwo.cpp C++ 


源 程序 )，7 
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precedence (前 趋 )，27 
PrecisionExample.cpp (Precision- 
Example.cpp C++ 源 程序 )，164 
predicate function (谓词 图 数 )，41，62 
prefix operator ( 前缀 操作 符 )，333 
preorder traversal (前 序 遍历 )，704 
prime factorization ( 素 因数 分 解 )，52 
prime number (素数 )，117 
primitive type (基本 类 型 )，19 
priority queue (优先 队列 )，661，719，806 
private keyword (private 关键 字 )，264 
procedural paradigm (过 程 程序 设计 范 型 )，4 
procedure (过 程 )，62 
programming abstraction (编程 抽象 )，85 
prompt (提示 符 )，11 
promptUserForFile function (promptUser- 
ForFile pA), 172 
proper divisor (公约 数 )，117 
proper subset (真子 集 )，740 
protected keyword (protected 关键 字 )，836 
prototype (原型 )，10，62 
pseudorandom number ( 伪 随 机 数 )，91 
Ptolemy I ( 托 勒 密 一 世 )，58 
ptr fun function (ptr fun 函数 )，910 
public keyword (public XF), 264 
pure virtual method (£t 7714), 826 
push method (push 方法 )，212 
put method (put F), 170, 172, 227 
Q 
quadratic equation (二 次 方程 式 )，74 
quadratic time (二 次 方 时 间 )，439，450 
Quadratic.cpp (Quadratic.cpp CH 源 程序 )， 
76 
qualifier (限定 符 )，268 
question-mark colon (问号 冒号 )，36 
queue (队列 )，217 
Queue class (Queue #), 217, 634 
queue.h interface (queue.h 接口 )，635 
Quicksort (快速 排序 )，452 
R 
radioactive decay (放射 衰减 )，121 
raiselntToPower function ( raiseIntInt- 
ToPower PREX), 344 


raiseToPower function ( raiseToPower PA 
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rand function (rand PRÉ), 91 

RAND MAX constant (RAND MAX 常量 )，91 

random number (随机 数 )，90 

random.cpp (random.cpp C++ 源 程序 )，105 

random access memory (随机 存储 器 ，RAM )，434 

RandomAccessIterator (RandomAccess- 
Iterator), 891 

RandTest.cpp (RandTest.cpp C++ 源 程 序 )， 
92 

range-based for loop (基于 范围 的 for 循环 )，238 

rational arithmetic (有 理 数 运算 )，282 

Rational class (Rational 类 )，288 

rational number (有 理 数 )，281 

rational.cpp (rational.cpp C++ 源 程序 )， 
290 

rational.h interface (rational.h 接口 )，288 

read-eval-print loop ( 读 写 循环 )，842 

read-until-sentinel pattern ( 读 直 到 哨兵 模式 )，43 

real number (实数 )，738 

realToString function ( realToString Mix), 
146 

receiver (接收 器 )，129 

record (记录 )，262 

Rect class (Rect 类 )，832 

recurrence relation (递归 关系 )，326 

recursion (递归 )，316 

recursive decomposition (递归 分 解 )，318 

recursive descent (递归 下 降 )，864 

recursive leap of faith (递归 的 稳步 跳跃 )，324 

recursive paradigm (递归 范 型 )，318 

red-black tree( 红 黑 树 )，732 

reductionism (简化 论 )，338 

reference parameter (引用 参数 )，73 

rehashine (重新 哈 希 )，682 

relation (关系 )，740 

relational operator (关系 运算 符 )，34 

remove method (remove 方法 )，200，227，232 

repeatChar function (repeatChar PA), 136 

replace function (replace AM), 130 

replace if function (replace if PAX), 908 

replaceAl11 function (replaceAll PARC), 151 

reserved word (保留 关键 字 )，16 

resize method (resize 方法)，210 
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retractMove method ( retractMove 方法 )， 
415 

return address (返回 地 址 )，113 

return by reference (引用 返回 )，272 

RETURN key (RETURN 键 )，12 

return statement (return 语句 )，57 

reverse function (reverse MX), 137 

Reverse Polish Notation (RPN) [ XE UE = ik ig ff 
(RPN)], 213 

ReverseFile.cpp (ReverseFile.cpp C++ 
源 程序 )，204 

right child ( 右 孩 子 )，694 

right manipulator ( 右 操 纵 符 )，162 

right rotation ( 右 旋转 )，710 

right-associative ( 右 结合 )，28 

right-hand rule (右手 规则 )，390 

rightFrom function (rightFrom AiR), 80 

ring buffer (环形 缓冲 区 )，639 

Ritchie, Dennis (丹尼斯 里 奇 )，2，4 

Robson, David (KE * 罗 伯 森 )，5 

Roman numerals (罗马 数字 )，685 

root ( 根 )，191，690 

roundToSignificantDigits, 872 

row-major order ( 行 优 先 次 序 )，239 

Rowling, J.K.〈 乔 安娜 ， 凯瑟琳， 罗 琳 )，51 

RPNCslculator.cpp (RPNCslculator.cpp 
C++ 源 程序 )，215 

S 

sample run (示例 运行 )，7 

saveToken Imethod (saveToken 方法 )，294 

scalar type (标量 类 型 )，39 

scaling (缩放 )，99 

scanNumber method (scanNumber 方法 )，294 

scanStrings method (scanStrings Jjik), 294 

scientific manipulator (科学 操纵 符 )，162 

scope (范围 )，14，526 

Scrabble (涂鸦 )，150 

searching (搜索 )，335 

seed (种 子 )，103 

selection sort algorithm (选择 排序 算法 )，431 

selection (选择 )，496 

sender (发 送 器 )，129 

sentinel (哨兵 )，42 

set (集合 )，232，738 


Set class (Set 类)，232 

set difference (42422), 232, 740 

set equality (集合 相等 )，740 

set method (set 方法 )，200，210 

setfill manipulator (set£i11 操纵 符 )，162 

setlnput method (setInput 方法 )，294 

setprecision manipulator ( setprecision 操 
WRF), 162 

setter (设置 器 )，267 

setting a bit (设置 一 位 )，758 

setwmanipulator (setw 操纵 符 )，162 

shadowing (Gli), 267 

Shakespeare, William (威廉 :莎士比亚 )，887 

shallow copy (XH 01), 546 

Shaw, George Bernard (乔治 : WHAHA), 151 

Shelley, Mary (玛丽 53), 515 

short type (short 类 型 )，19 

short-circuit evaluation (短路 求 值 )，35 

shorthand assignment (缩写 赋值 )，32 

showContents method ( showContents 方法 )， 
576 

ShowFileContents.cpp (ShowFile- 
Contents.cpp C++ 源 程序 )，173 

showpoint manipulator ( Showpoint 操纵 符 )， 
162 

showpos manipulator ( showpos 操纵 符 )，162 

sibling (兄弟 )，691 

Sierpinski Triangle ( 谢 尔 宾 斯 基 三 角形 )，387 

Sierpiński, Waclaw (瓦斯 瓦 ， 谢 尔 宾 斯 基 )，387 

sieve of Eratosthenes ( 爱 拉 托 逊 斯 得 法)，249 

signature (签名 )，63 

simpio.h interface (simpio.h 接口 )，186 

simple case (简单 情况 )，318 

simple cycle (简单 回路 )，771 

simple path (简单 路 )，771 

simple statement (简单 语句 )，36 

simplifications of big-O CX O 的 简化 )，436 

SIMULA, 4 

simulation (fj t), 219 

sin function (sin PAR), 61, 893 

sinDegrees function (sinDegrees PR), 84 

single rotation ( 单 向 旋转 )，710 

size method ( size 方 法 )，212，218，227，232， 
236 
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size ttype(size 七 类 型 )，132 

sizeof operator (sizeof 操作 符 )，479 

skipws manipulator (skipws 操纵 符 )，166 

slicing (切片 )，830 

Smalltalk, 5 

Snowflake.cpp (Snowflake .cpp C++ 源 程序 )， 
374 

solveMaze (solveMaze PAR), 397 

sort function (sort FRX), 908 

sorting (HEF), 430 

source file ( 源 文件 )，6 

spanning tree (扫描 树 )，819 

sparse graph (解析 图 )，774 

sqrt function (sqrt PAR), 61 

stand function (stand pA), 103 

<sstream> library («sstream» JÆ), 177 

stack (f£), 211 

stack area (FRX), 481 

Stack class (Stack 2), 211, 619 

Stack constructor (Stack 构造 函数 )，212 

stack frame (Riwi), 65, 481 

stack machine (BL), 883 

stack-based editor (基于 栈 的 编辑 器 )，586 

stack.h interface (stack.h 接口 )，620 

standard deviation (标准 差 )，247 

Standard Template Library (标准 模板 库 )，197 

Stanford libraries (Stanford FF), 107, 186 

startsWith function ( startsWith PR), 135, 
146 

state (状态 )，407 

statement (语句 )，36 

static allocation (静态 分 配 )，516 

static analysis (静态 分 析 )，413 

static area (静态 区 )，481 

static initialization (静态 初始 化 )，496 

static keyword (static 关键 字 )，104 

static local variable (静态 局 部 变量 )，104 

std namespace (std 名 字 空 间 )，9，79 

stepwise refinement ( 步 长 精 化 )，58 

STL, 197 

stock-cutting problem (下 料 问题 )，424 

Stoppard, Tom (汤姆 * 斯 托 由 德 )，122 

str function (str K), 179 

stream (fit), 23, 126 


string class (string 类 ), 24, 126 

string comparison (字符 串 比 较 )，130 

string constructor (FIFRE K), 130 

<string> library (<string> JF), 24 

string literal (字符 串 字 面值 )，126 

string methods (字符 串 方法 )，130 

string stream (字符 串 流 )，177 

StringMap class (StringMap 类 )，664，824 

stringToInteger function (stringToIn- 
teger PK), 146 

stringToReal function ( stringToReal PH 
BL), 146 

strlib.h function (strlib.h fÉL1), 146, 186 

strongly connected (98338 ), 772 

Stroustrup, Bjarne (本 贾 尼 … 斯 特 劳 斯 特 卢 普 )，5 

structure (结构 )，262 

subclass ( 子 类 )，184 

subset ( 子 集 )，740 

subset-sum problem ( 子 集合 问题 )，361 

subsetSumExists function (subsetSum- 
Exists PIR), 363 

substr (字符 串 方 法 )，130，133 

substring ( 子 串 )，133 

subtree ( 子 树 )，692 

successive approximation (逐次 通 近 法 )，118 

Sudoku,” 209, 251 

Suetonius ( 苏 维 托尼 乌 斯 )，155 

suffix operator (Ji £& RIETI), 33 

Sun Tzu (孙子 )，349 

superclass ($825), 184 

swap function (swap PK), 492, 908 

SwapIntegers.cpp (SwapIntegers.cpp 
C++ 源 程序 )，493 

switch statement (switch 语句 )，38 

symbol table (ff), 226, 844 

symmetric matrix (对 称 和 矩阵 )，774 

T 

tail of a queue (AE), 217 

taking the complement (Hh), 756 

target (目标 )，485 

template (模板 )，198，616 

template class (模板 类 )，619 

template specialization (模板 实例 化 )，760 

term (术语 )，26 
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terminal symbol (终结 符号 )，863 

termination condition (终止 条 件 )，41 

text data (文本 数据 )，126 

text file (文本 文件 )，167 

The Phantom Tollbooth (《 神 奇 的 收费 亭 》)，313 

Theseus ( 提 休 斯 )，390 

this keyword (this 关键 字 )，490 

three-pile Nim (三 堆 拿 子 )，426 

throw statement (throw 语句 )，845 

throwing an exception ( 抛 出 一 个 异常 )，845 

Thurber, James (詹姆斯 * 瑟 伯 )，193 

tic-tac-toe (TFH), 426 

time-space tradeoff (时 — 空 平衡 )，607 

time function (time PEAK), 103 

Titius-Bode law ( 提 委 斯 - 波 得 定律 )，344 

Titius, Johann Daniel (JC 589 - FER EEH), 
344 

toDegrees function (toDegrees PRX), 84 

token (id), 292, 842 

TokenScanner class (TokenScanner 25), 292 

TokenScanner constructor ( TokenScanner 
构造 函数 )，294 

tokenscanner.cpp (tokenscanner.cpp 
C++ 源 程序 )，300 

tokenscanner.h interface ( tokenscanner.h 
接口 )，298 

Tolkien, J. R. R. (J.R.R. 托 尔 金 )，519，724 

tolower function (toLower 函数 )，137 

toLowerCase function ( toLowerCase PR % ), 
146 

top-down design ( 自 顶 向 下 的 设计 )，58 

toRadians function (toRadians PAR), 84 

toupper function (toupper PAR), 137 

toUpperCase function ( toUpperCase PK XX), 
146 

Towers of Hanoi puzzle ( 汉 诺 塔 游戏 )，350 

tractable (易于 处 理 的 )，452 

transient property (透明 性 )，161 

translation (翻译 )，99 

traveling salesman problem (旅行 商 问 题 )，452 

traversing a graph (遍历 一 个 图 )，783 

traversing a tree (遍历 一 棵 树 )，704 

tree ( 树 )，690 

trie (字典 树 )，735 


trim function (trim PAR), 146 

true constant (true 常量 )，21 

truncation (截断 )，29 

truth table ( 真 值 表 )，35 

try statement (try 语句 )，845 

Twain, Mark (457g + 叶 温 )，195 

two's complement arithmetic (二 进 制 补 码 )，478 

TwoLetterWords.cpp (TwoLetterWords. 
cpp C++ 源 程序 )，237 

TwoPlayerGame class ( TwoPlayerGame 类 )， 
880 

type cast (类 型 转型 )，30 

type conversion hierarchy (类 型 转换 层次 )，28 

type of a variable (变量 的 类 型 )，14 

typename keyword (typename 关键 字 )，617 

U 

UML diagram (UML 图 )，184 

unary operator (一 元 运算 符 )，27 

unary_function class (unary_function 
类 )，910 

undirected graph (无 向 图 )，770 

unget method (unget 771A), 170, 174 

union (Jf), 232, 739 

unit testing (单元 测试 )，544 

universal modeling language (统一 建 模 语言 )，184 

unparsing (无 解析 )，883 

unsigned keyword (unsigned 关键 字 )，20 

uppercase manipulator (uppercase 操纵 符 )， 
162 

V 

value assignment ( 值 赋值 )，489 

value parameter ( 值 参 )，74 

variable (变量 )，14 

variable declaration (变量 声明 )，11 

variable name (变量 名 )，14 

Vector class (Vector 类 )，197，649 

Vector constructor (Vector 构造 函数 )，206 

vector.h interface (vector .h 接口 )，650 

Venerable Bede ( 圣 比 德 )，118 

Venn diagram ( 文 氏 图 )，740 

Venn, John (约翰 ' 维 恩 )，740 

verifyToken method ( verifyToken 方法 )， 
294 

vertex (顶点 )，768 


visiting a node (访问 一 个 结 点 )，783 


von Neumann architecture (13 - 诺 依 曼 体系 结构 )， 


893 
von Neumann, John ( 约 输 * 13 - WKE), 893 
W 
walking a tree (ii Jj), 704 
Wallinger, Mark (马克 ' HRA), 385 
wchar ttype (wchar_t 类 型 )，478 
weakly connected (353144), 772 
Weil, Simone (西蒙 娜 ， 韦 伊 )，389 
while statement (while 语句)，41 
whitespace character (空白 字符 )，127，137 
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wildcard pattern (通配符 模式 )，425 
Woolf, Virginia (弗吉尼亚 伍 尔 夫 )，473 
word (单词 )，475 
WordFrequency.cpp (WordFrequency.cpp 
C++ WEF), 243 
worst-case complexity (XR fj & Ze HE), 440 
wrapper (包装 器 )，331 
ws manipulator (ws 操作 符 )，166 
wysiwyg( 所 见 即 所 得 )，572 
X 
Xerox PARC (施乐 PARC), 5 
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本 书 是 一 本 风格 独特 的 C++ 语言 教材 ， 内 容 源 自作 者 在 斯 坦 福 大 学 多 年 成 功 的 教学 实践 。 它 突破 了 
一 般 C++ 编 程 教材 注重 介绍 C++ 语法 特性 的 局 限 ， 不 仅 全 面 讲解 了 C++ 语言 的 基本 概念 ， 而 且 将 重点 放 
在 深入 剖析 编程 思路 上 ， 并 以 循序 渐进 的 方式 教授 读者 正确 编写 可 行 高 效 的 C++ 程 序 。 本 书 内 容 遵 循 
ACM CS2013 关 于 程序 设计 课程 的 要 求 ， 既 适合 作为 高 校 计算 机 及 相关 专业 学 生 的 教材 或 教学 参考 书 ， 
也 适合 希望 学 习 C++ 语 言 的 初学 者 和 中 高 级 程序 员 使 用 。 
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